AI Tech Briefing

OpenAI Codex CLI

OpenAI Codex CLI는 interactive TUI와 non-interactive exec를 모두 갖춘 작업형 coding agent CLI다.

2026-04-20

왜 중요한가

  • 실무적으로 중요한 건 모델 자체보다 실제 작업을 어떤 실행 표면과 안전 장치 위에서 굴리느냐다.
  • Codex CLI는 sandbox, approval, MCP, cloud task, review, resume/fork까지 포함한 꽤 본격적인 작업 표면을 제공한다.
  • interactive와 batch 모드를 함께 제공해 수동 보조와 자동화 양쪽 흐름에 모두 닿는다.

핵심 관찰

  • 공개 repo와 공식 문서를 대조해 구조를 확인했다.
  • README 기준 설치 경로는 npm i -g @openai/codex 또는 brew install --cask codex였다.
  • npm view @openai/codex 기준 최신 버전은 0.121.0, 실행 bin은 codex였다.
  • npx @openai/codex --help를 직접 실행했더니 exec, review, login, mcp, mcp-server, app-server, sandbox, resume, fork, cloud, features 같은 하위 명령이 실제로 노출됐다.
  • 전역 옵션에도 --sandbox, --ask-for-approval, --full-auto, --search, --oss, --local-provider, --remote 등이 있었다.
  • npx @openai/codex exec --help까지 확인해보니 비대화형 실행에서도 --json, --output-schema, --ephemeral, --skip-git-repo-check, --output-last-message 같은 자동화 친화 옵션이 준비돼 있었다.
  • docs/install.md 기준 공식 시스템 요구사항은 Windows 11도 WSL2를 전제로 적고 있었다.
  • repo 구조도 codex-cli, codex-rs, sdk 등으로 나뉘어 있어 단일 스크립트보다 제품형 CLI 스택에 가깝다.
  • 실제 agent run은 로그인/API 키 없이 진행하지 않았고, help와 설치 표면, 실행 옵션까지만 검증했다.

해석

OpenAI Codex CLI는 interactive TUI와 non-interactive exec를 모두 갖춘 작업형 coding agent CLI다.

누구에게 도움이 되나

  • 개발팀: 로컬 코드베이스 작업용 coding agent CLI
  • 플랫폼팀: 비대화형 agent 실행을 CI나 스크립트에 연결하는 실험
  • 파워유저: interactive TUI와 batch exec를 함께 쓰는 개인 개발 흐름

어디에 바로 써볼 수 있나

  • coding agent CLI가 sandbox, approval, MCP, cloud task를 어떻게 한 표면에 묶는지 분석
  • 반복 작업은 exec 모드로 자동화하고 수동 작업은 TUI로 수행하는 혼합형 흐름 실험
  • approval policy, session resume/fork, MCP server 표면 설계 참고
  • 로컬 코드베이스 작업용 coding agent CLI
  • 비대화형 agent 실행을 CI나 스크립트에 연결하는 실험
  • interactive TUI와 batch exec를 함께 쓰는 개인 개발 흐름

주요 출처

공식 repo / docs

주의점

  • Windows도 지원은 언급되지만 공식 문서는 WSL2를 전제로 한다.
  • 실제 효용은 로그인, provider 설정, sandbox 정책 설계까지 들어가야 나온다.
  • 강한 실행 옵션은 위험할 수 있어 승인 정책과 외부 샌드박스가 중요하다.
  • 즉 데모 도구라기보다 강한 실행 도구에 가깝고, 운영 습관이 같이 필요하다.

다음에 볼 포인트

  • 세션 메모리와 장기 메모리의 범위 분리가 더 명시적인 제품 기본값으로 굳어지는지 볼 것.
  • skills, orchestration, writable memory를 어떤 정책 경계로 나누는지 비교할 것.