"우리는 AGI까지 70~80% 왔습니다." 2026년 3월 24일, OpenAI 내부에서 나온 이 발언이 AI 커뮤니티 전체를 뒤흔들었습니다. 같은 날, OpenAI의 차세대 모델 'Spud'의 사전 학습이 텍사스주 애빌린 Stargate 데이터센터에서 완료됐어요. 10만 개가 넘는 H100·GB200 GPU를 동원한 이 훈련 작업은 OpenAI 역사상 가장 큰 규모였습니다. GPT-5.5 혹은 GPT-6로 출시될 예정인 이 모델, 도대체 얼마나 강력한 건지, 언제 나오는 건지, 지금 당장 뭘 준비해야 한번 알아보도록 하겠습니다.
코드네임 Spud의 개념부터..
OpenAI는 모델에 내부 코드명을 붙이는 문화가 있어요. GPT-4.5는 'Orion'이었고, 이번 차세대 모델의 코드명은 'Spud'입니다. 감자(Potato)의 별명이에요. Google은 디저트, Microsoft는 도시 이름을 쓰는데, OpenAI는 채소를 택했죠.
이 코드명은 The Information이 2026년 3월 24일 사전 학습 완료 사실과 함께 처음 보도했고, 이후 샘 알트만 CEO가 직원들에게 "매우 강력한 모델로, 경제를 실질적으로 가속시킬 수 있을 것"이라고 직접 언급하면서 공식 확인됐습니다. 그렉 브록만도 팟캐스트 인터뷰에서 "2년간의 연구가 담긴 모델"이라고 표현했어요.
최종 출시명이 GPT-5.5가 될지 GPT-6가 될지는 아직 공식 발표가 없어요. GPT-5.4 대비 벤치마크 향상 폭이 얼마나 크냐에 따라 결정될 가능성이 높습니다.
출시일은 정확히 언제인가요?
사전 학습 완료는 출시가 아닙니다. 이후 후처리 단계가 남아있어요. 강화학습, 안전성 평가, 레드팀 테스트, 인프라 확장이 필요합니다. 최근 OpenAI 모델들의 이 단계 소요 시간은 보통 3~6주였어요.
출시가능시점 :
- Polymarket: 4월 30일 이전 출시 확률 78%, 6월 30일 이전 출시 확률 95% 이상
- Manifold: 비슷한 수준의 높은 신뢰도
- 'ThursdAI' 패턴: OpenAI가 주요 발표를 목요일에 하는 경향이 있어, 커뮤니티에서는 4월 23일(목) 출시 가능성을 높게 봤어요
3월 24일 사전 학습 완료 기준으로 4~6주 후처리를 가정하면 4월 말~5월 초가 가장 유력한 출시 시점으로 보입니다.
예상 성능 — 뭐가 달라질까
공식 벤치마크는 아직 없어요. 다만 GPT-5.x 시리즈의 진화 경로와 내부 개발 방향을 보면 어느 정도 예측할 수 있습니다.
코딩과 에이전트 능력 강화
OpenAI는 Spud를 '통합 슈퍼 앱'의 핵심 엔진으로 설계했습니다. ChatGPT·Codex·딥 리서치·메모리·에이전트 기능을 하나의 플랫폼에 통합하는 전략이에요. 2026년 4월 초에 Codex CLI의 플러그인 및 멀티에이전트 워크플로우 업데이트가 집중적으로 이루어진 것도, 이 통합을 위한 인프라 준비로 해석됩니다.
추론 능력 대폭 향상 예상
GPT-5.x 시리즈마다 GPQA 추론 벤치마크에서 5~15% 향상이 있었어요. 이 추세를 따르면 Gemini 3.1 Pro의 94.3%와 Claude Opus 4.7의 94.2%에 근접하거나 넘어설 가능성이 있습니다. Spud의 후처리가 파라미터 규모 확대보다 강화학습(RL)에 집중됐다는 점도 추론 능력 향상을 시사해요.
멀티모달 및 컴퓨터 사용 개선
GPT-5.4에서 네이티브 컴퓨터 사용 기능이 처음 도입됐고(OSWorld 75.0%), Spud는 이 능력을 더욱 고도화할 것으로 예상됩니다. 이미지·영상·오디오를 동시에 처리하는 멀티모달 능력도 개선될 것이라는 게 업계의 공통된 예측이에요.
GPT-5.4와 비교해서 뭐가 부족했나
Spud가 어떤 방향으로 개선됐는지를 이해하려면 GPT-5.4의 한계를 알아야 합니다. GPT-5.4는 지식 업무(GDPval 83%)와 컴퓨터 사용(OSWorld 75%)에서 강했지만, 코딩 에이전트에서 Claude에 밀렸습니다. SWE-bench에서 GPT-5.4는 74.9%로 Claude Opus 4.7(87.6%)에 크게 뒤졌고, Grok 4.20(75%)에도 근소하게 뒤처졌어요. Gemini 3.1 Pro가 16개 주요 벤치마크 중 13개를 이기면서 OpenAI는 사실상 전방위적인 경쟁 압박에 놓였습니다.
샘 알트만이 2025년 12월부터 내부적으로 '코드 레드' 기조를 강조했다는 소식도 이 맥락에서 나온 거예요. Spud는 이 상황을 반전시키기 위한 OpenAI의 핵심 카드입니다.
왜 지금 가장 중요한 모델인가
Spud는 단순한 버전 업그레이드를 넘어서는 의미를 갖습니다. 몇 가지 큰 맥락이 있어요.
Stargate 데이터센터 첫 모델: Spud는 미국 텍사스에 구축된 Stargate 데이터센터의 새 컴퓨팅 인프라에서 처음 훈련된 모델입니다. 이 인프라는 OpenAI가 AI 인프라 주도권 확보를 위해 투자한 대형 프로젝트예요.
IPO 전 마지막 플래그십: OpenAI는 2026년 3월 기업 가치 8,520억 달러로 1,220억 달러를 조달했습니다. IPO를 앞두고 기술력을 증명해야 하는 상황에서, Spud의 성능은 단순한 제품 업데이트가 아닌 회사의 가치를 결정짓는 수단이기도 해요.
ChatGPT 슈퍼 앱 전략: Sora 서비스 종료(컴퓨팅 자원을 Spud로 재배분), Disney와의 파트너십 종료 등 일련의 정리 작업이 모두 Spud 출시를 위한 자원 집중으로 해석됩니다.
개발자·기업을 위한 체크업 리스트
Spud 출시 전에 미리 준비해두면 좋은 사항들이에요.
- API 추상화 레이어 구축: 모델을 직접 호출하는 코드 대신, 프로바이더 교체가 쉬운 추상화 계층을 미리 만들어두세요. Spud 출시 시 빠르게 전환·평가할 수 있어요.
- 현재 GPT-5.4로 기준점 설정: 지금 주요 워크플로우에서 GPT-5.4의 성능을 측정해두면, Spud 출시 후 실질적 향상이 얼마나 되는지 바로 판단할 수 있습니다.
- 에이전트 워크플로우 설계 시작: Spud가 통합 슈퍼 앱의 엔진이 될 예정인 만큼, 에이전트 기반 워크플로우에 익숙해지는 게 도움됩니다.
OpenAI의 차세대 AI, GPT 5.5 Squd
GPT-5.5 'Spud'는 OpenAI의 가장 야심 찬 모델입니다. 사전 학습은 완료됐고, 안전 평가와 후처리 단계만 남았어요. Polymarket의 78% 확률이 보여주듯 4월 말~5월 초 출시 가능성이 가장 높습니다.
코딩 에이전트에서 Claude에 뒤진 격차를 메우고, 추론과 멀티모달 전반을 끌어올리는 게 핵심 목표예요. AI 경쟁이 가장 치열한 이 시점에, 어떤 AI를 써야 하는지보다 어떻게 여러 AI를 유연하게 활용할 수 있는 구조를 갖추느냐가 훨씬 중요해졌습니다.
0 댓글