OpenAI가 Sora Android 앱을 28일 만에 출시한 방법: Codex와 4명의 엔지니어
OpenAI가 Sora Android 앱을 28일 만에 출시한 방법: Codex와 4명의 엔지니어
플레이스토어 1위. 24시간 만에 100만 개 비디오 생성. 앱 안정성 99.9%. OpenAI의 Sora Android 앱이 출시 첫날 기록한 숫자들이다. 놀라운 건 이 앱이 단 28일 만에, 4명의 엔지니어에 의해 만들어졌다는 사실이다.
보통 이 정도 규모와 품질의 프로덕션 앱을 만들려면 수십 명의 엔지니어가 수개월을 매달려야 한다. 조율하고, 회의하고, 통합하는 데만 엄청난 시간이 든다. 그런데 OpenAI는 정반대 전략을 택했다. 그리고 그 중심에는 Codex가 있었다.
브룩스 법칙을 역이용하다
컴퓨터 과학자 프레드 브룩스는 유명한 말을 남겼다. "늦어진 소프트웨어 프로젝트에 인력을 추가하면 더 늦어진다." 사람이 늘어나면 커뮤니케이션 오버헤드가 늘고, 작업이 파편화되고, 통합 비용이 치솟기 때문이다.
OpenAI 팀은 이 통찰을 무시하는 대신 받아들였다. 사람은 4명으로 유지하되, 각 엔지니어에게 Codex를 붙여 개인의 임팩트를 극대화했다. 10월 8일부터 11월 5일까지, 이 작은 팀은 약 50억 개의 토큰을 소모하며 Sora Android를 프로토타입에서 글로벌 출시까지 끌어올렸다.
여기서 중요한 건 그들이 비밀 모델을 사용한 게 아니라는 점이다. GPT-5.1-Codex의 초기 버전, 지금 누구나 CLI나 IDE 확장, 웹 앱을 통해 사용할 수 있는 바로 그 모델이었다.
Codex를 "새로 들어온 시니어 엔지니어"처럼 대하다
OpenAI 팀이 Codex와 효과적으로 협업한 비결은 Codex를 도구가 아닌 새로 합류한 시니어 엔지니어처럼 대한 것이었다. 시니어니까 코딩 능력은 출중하다. 하지만 회사의 선호 아키텍처 패턴, 제품 전략, 실제 사용자 행동, 내부 규칙 같은 것들은 모른다.
Codex가 잘하는 영역은 명확했다. 대규모 코드베이스를 빠르게 읽고 이해하는 것, 다양한 케이스를 커버하는 유닛 테스트를 열정적으로 작성하는 것, 피드백에 반응하는 것, 그리고 여러 아이디어를 병렬로 탐색하는 것. CI가 실패하면 로그를 붙여넣고 수정안을 요청하면 됐다.
반면 Codex가 안내가 필요한 영역도 있었다. 앱을 실제로 실행해서 스크롤 감촉이 어색한지, 흐름이 헷갈리는지 느끼는 건 오직 인간만 할 수 있었다. 장기적인 아키텍처 판단도 약했다. Codex의 본능은 일단 돌아가게 만드는 것이지, 장기적인 깔끔함을 우선시하는 게 아니었다.
기초는 인간이 직접 놓았다
가장 뛰어난 시니어도 첫날부터 장기적 트레이드오프를 올바르게 판단할 수는 없다. Codex를 활용하면서도 그 결과물이 견고하고 유지보수 가능하게 만들려면, 앱의 시스템 설계와 핵심 의사결정은 팀이 직접 해야 했다.
앱의 아키텍처, 모듈화, 의존성 주입, 네비게이션을 설계하고 인증과 기본 네트워킹 플로우를 구현했다. 그 다음 몇 가지 대표 기능을 처음부터 끝까지 직접 만들었다. 전체 코드베이스가 따라야 할 규칙을 적용하면서 프로젝트 전반의 패턴을 문서화했다.
이 대표 기능들을 Codex에게 보여주자, Codex는 그 표준 안에서 훨씬 더 독립적으로 작업할 수 있게 됐다. 85%가 Codex에 의해 작성된 프로젝트에서, 이렇게 신중하게 계획된 기초는 비용이 큰 재작업과 리팩토링을 피하게 해준 가장 중요한 결정이었다.
팀은 "가능한 한 빨리 돌아가는 것"을 만들려 한 게 아니었다. "우리가 원하는 방식으로 돌아가는 것"을 만들려 했다. 코드를 작성하는 올바른 방법은 많다. Codex에게 정확히 무엇을 해야 하는지 말해줄 필요는 없었다. 우리 팀에서 무엇이 올바른지를 보여주면 됐다.
코딩 전에 계획부터
Codex의 잠재력을 최대화하는 다음 단계는 Codex가 오랜 시간 동안 감독 없이 일할 수 있게 하는 방법을 찾는 것이었다.
초기에는 "여기 기능이야. 여기 파일들이야. 만들어줘" 같은 프롬프트로 바로 뛰어들었다. 가끔은 잘 됐지만, 대부분은 기술적으로 컴파일은 되지만 아키텍처와 목표에서 벗어난 코드가 나왔다.
그래서 워크플로우를 바꿨다. 사소하지 않은 변경에는 먼저 Codex에게 시스템과 코드가 어떻게 작동하는지 이해하도록 요청했다. 관련 파일들을 읽고 그 기능이 어떻게 작동하는지 요약하게 했다. 데이터가 API에서 리포지토리 레이어, 뷰 모델, UI로 어떻게 흐르는지. 그 다음 이해도를 수정하거나 다듬어줬다.
새로 합류한 뛰어난 팀원과 대화하듯, Codex와 함께 견고한 구현 계획을 세웠다. 그 계획은 어떤 파일이 변경되어야 하는지, 어떤 새로운 상태가 도입되어야 하는지, 로직이 어떻게 흘러야 하는지를 지시하는 미니 설계 문서처럼 보였다. 그제야 Codex에게 계획을 한 단계씩 적용하도록 요청했다.
이 추가적인 계획 단계는 시간을 들일 가치가 있었다. Codex를 오랜 시간 "무감독"으로 돌릴 수 있었다. 계획을 알고 있었으니까. 코드 리뷰도 쉬워졌다. 맥락 없이 diff를 읽는 대신 계획 대비 구현을 확인할 수 있었다. 문제가 생기면 코드보다 계획을 먼저 디버깅할 수 있었다.
팀을 관리하는 것 같은 느낌
프로젝트의 피크 때, 팀은 종종 여러 Codex 세션을 동시에 돌렸다. 하나는 재생 기능, 다른 하나는 검색, 또 다른 하나는 에러 처리, 때로는 테스트나 리팩토링을 위한 세션도 있었다. 도구를 사용한다기보다 팀을 관리하는 느낌이었다.
각 세션은 주기적으로 진행 상황을 보고했다. 하나는 "이 모듈 계획을 다 세웠어요. 제안은 이거예요"라고 하고, 다른 하나는 새 기능을 위한 큰 diff를 내놨다. 각각 관심, 피드백, 리뷰가 필요했다. 여러 명의 신입 엔지니어가 있는 테크 리드가 되는 것과 묘하게 비슷했다.
결과는 협업적인 흐름이었다. Codex의 원시적인 코딩 능력 덕분에 직접 타이핑하는 수고에서 벗어났다. 아키텍처에 대해 생각하고, PR을 신중하게 읽고, 앱을 테스트할 시간이 더 생겼다. 동시에, 그 추가적인 속도는 리뷰 큐에 항상 무언가가 대기하고 있다는 걸 의미했다. 개발의 병목이 코드 작성에서 결정, 피드백, 통합으로 이동했다.
크로스플랫폼의 미래
OpenAI 팀은 거대한 디딤돌로 프로젝트를 시작했다. Sora가 이미 iOS에서 출시되어 있었다. 팀은 자주 Codex에게 iOS와 백엔드 코드베이스를 가리키며 핵심 요구사항과 제약을 이해하도록 도왔다.
프로젝트 내내 팀은 크로스플랫폼 프레임워크라는 개념을 재발명했다고 농담했다. React Native는 잊어라. Flutter도 잊어라. 크로스플랫폼의 미래는 그냥 Codex라고.
이 농담 뒤에는 두 가지 원칙이 있다. 첫째, 로직은 이식 가능하다. Swift든 Kotlin이든, 기저의 애플리케이션 로직(데이터 모델, 네트워크 호출, 검증 규칙, 비즈니스 로직)은 같다. Codex는 Swift 구현을 읽고 의미를 보존하면서 동등한 Kotlin 코드를 생성하는 데 매우 뛰어나다. 둘째, 구체적인 예시는 강력한 맥락을 제공한다. "iOS에서 이게 정확히 어떻게 작동하는지"와 "Android 아키텍처가 뭔지"를 볼 수 있는 새 Codex 세션은 자연어 설명만으로 작업하는 것보다 훨씬 효과적이다.
AI 시대 소프트웨어 엔지니어의 슈퍼파워
4주간의 스프린트가 끝날 무렵, Codex를 사용하는 건 실험처럼 느껴지지 않았다. 기본 개발 루프가 됐다. 기존 코드를 이해하고, 변경을 계획하고, 기능을 구현하는 데 사용했다. 팀원의 코드를 리뷰하듯 그 결과물을 리뷰했다. 그냥 소프트웨어를 출시하는 방식이 됐다.
AI 지원 개발이 엄격함의 필요성을 줄이지 않는다는 게 분명해졌다. 오히려 늘린다. Codex가 아무리 유능해도, 그 목표는 지금 당장 A에서 B로 가는 것이다. 이게 AI 지원 코딩이 인간 없이는 작동하지 않는 이유다. 소프트웨어 엔지니어는 시스템의 실제 제약을 이해하고 적용할 수 있고, 소프트웨어를 설계하는 최선의 방법을 알고, 미래 개발과 제품 계획을 염두에 두고 빌드할 수 있다.
내일의 소프트웨어 엔지니어의 슈퍼파워는 깊은 시스템 이해와 AI와 장기간에 걸쳐 협업하는 능력이 될 것이다.
소프트웨어 엔지니어링의 가장 흥미로운 부분은 매력적인 제품을 만들고, 확장 가능한 시스템을 설계하고, 복잡한 알고리즘을 작성하고, 데이터와 패턴과 코드를 실험하는 것이다. 하지만 과거와 현재 소프트웨어 엔지니어링의 현실은 훨씬 더 단조로운 경우가 많다. 버튼 가운데 정렬하기, 엔드포인트 연결하기, 보일러플레이트 작성하기. 이제 Codex는 소프트웨어 엔지니어링의 가장 의미 있는 부분, 우리가 이 직업을 사랑하는 이유에 집중할 수 있게 해준다.
7개월 전 Codex가 리서치 프리뷰로 출시됐을 때만 해도, 소프트웨어 엔지니어링은 매우 달라 보였다. 28일 만에 플레이스토어 1위 앱을 만드는 세상. AI가 코드의 85%를 쓰는 세상. 우리는 이미 그 안에 살고 있다.
출처 : https://openai.com/index/shipping-sora-for-android-with-codex/
