2026년 4월 4일 새벽, AI 커뮤니티가 들썩였습니다. LM Arena 블라인드 테스트 플랫폼에 정체불명의 이미지 생성 모델 3개가 동시에 나타났어요. 코드명은 maskingtape-alpha, gaffertape-alpha, packingtape-alpha. 몇 시간 만에 사라졌지만, 그 사이 테스터들이 남긴 스크린샷은 AI 이미지 생성의 새로운 기준점을 보여줬습니다. 텍스트 렌더링 정확도 99%, 생성 속도 3초, 네이티브 4K 출력. 커뮤니티의 결론은 하나였어요. "이게 GPT Image 2다." DALL-E 2·3 서비스가 2026년 5월 12일 종료를 앞둔 지금, OpenAI의 이미지 생성 세대교체가 임박했습니다.

GPT image 2 LM arena


1. GPT Image 2는 어떻게 유출됐나

OpenAI는 신규 모델을 출시 전 LM Arena라는 블라인드 테스트 플랫폼에서 익명으로 먼저 테스트하는 패턴이 있어요. 사용자가 모델 이름을 모르는 상태에서 두 결과물을 비교 평가하고 ELO 점수를 매기는 방식이라, 마케팅 없이 순수한 실력 검증이 이루어지는 곳이에요.

2025년 12월에도 Chestnut, Hazelnut이라는 코드명으로 LM Arena 테스트를 거친 뒤 GPT Image 1.5를 출시한 전례가 있어요. 이번에 'tape 시리즈(maskingtape·gaffertape·packingtape)'라는 명명 패턴이 OpenAI의 기존 규칙과 정확히 일치해서, 커뮤니티는 GPT Image 2로 빠르게 결론 냈습니다.

개발자 Pieter Levels(@levelsio)와 투자자 Justine Moore가 최초로 이 모델들을 공개적으로 언급했어요. 몇 시간 만에 LM Arena에서 삭제됐지만, 그 사이 커뮤니티 테스터들이 다수의 샘플을 스크린샷과 영상으로 기록해뒀습니다. 동시에 ChatGPT iOS 앱 코드에서 image_announcement 관련 문자열도 발견됐어요. 정식 발표용 안내 페이지가 준비되고 있다는 신호입니다.

2. 5가지 핵심 업그레이드 — GPT Image 1.5와 뭐가 달라지나

1) 텍스트 렌더링 99% 달성 — AI 이미지의 고질적 약점 해결

지금까지 AI 이미지 생성의 가장 큰 불편함 중 하나가 이미지 안에 글자를 넣을 때 글자가 깨지거나 이상하게 나오는 문제였어요. GPT Image 1.5에서 영어 텍스트 정확도가 약 95%까지 올라왔지만, 한국어·일본어·중국어·아랍어 같은 비라틴 문자에서는 여전히 아쉬움이 있었습니다.

GPT Image 2는 이 수치를 99%까지 끌어올렸어요. LM Arena 블라인드 테스트에서 한국어(CJK) 렌더링도 글자 모양이 정확하고 획이 선명하다는 평가가 나왔습니다. 포스터·인포그래픽·UI 목업처럼 텍스트가 중요한 이미지 작업에서 획기적인 변화가 예상돼요.

2) 생성 속도 3초 — 기존 대비 최대 6배 빨라진다

GPT Image 1.5의 생성 시간은 8~18초 수준이었어요. GPT Image 2는 단일 추론 아키텍처를 채택해 약 3초로 단축됩니다. 창작 워크플로우에서 "기다리는 시간"이 사실상 사라지는 수준이에요. 반복 수정과 빠른 프로토타이핑이 일반화될 거예요.

3) 네이티브 4K 출력 + 16:9 지원 — 상업용 인쇄급 품질

기존 GPT Image 1.5의 최대 해상도는 1536×1024였어요. GPT Image 2는 4096×4096 네이티브 4K 출력과 16:9 와이드스크린 비율을 기본 지원합니다. 상업용 인쇄, 광고 배너, 영상 썸네일 제작에서 별도 업스케일링 없이 바로 활용할 수 있는 수준이에요.

4) 완전히 새로운 독립 아키텍처 — GPT-4o 기반 탈피

GPT Image 1.5까지는 GPT-4o 기반 아키텍처를 활용했어요. GPT Image 2는 완전히 독립적으로 설계된 새 아키텍처를 채택했고, 이게 단순 업그레이드가 아닌 세대교체인 이유입니다. 더 나아가 GPT Image 2는 GPT-5.5(Spud)의 멀티모달 이미지 생성 능력과 연결된 것으로 추정되고 있어요. 텍스트를 이해하기 전에 먼저 추론(reasoning) 단계를 거쳐 프롬프트의 의도를 파악한 뒤 픽셀을 생성하는 방식입니다.

5. 세계 지식 수준 도약 — 브랜드·UI·실제 사물 정확도 혁신

GPT Image 2의 가장 차별화된 특징 중 하나는 세계 지식(World Knowledge) 능력입니다. 실제 브랜드의 로고, 인터페이스 디자인, 사물의 구체적인 형태를 정확히 알고 이미지에 반영해요. UI 스크린샷 복원, 제품 목업, 실제 앱 인터페이스를 담은 이미지 생성에서 이전 모델과 비교가 안 될 수준이라는 평가가 나왔어요. 한 테스터는 "GPT Image 2와 Nano Banana Pro(Google)의 격차가, Nano Banana Pro와 DALL-E의 격차만큼이나 크다"고 표현했습니다.

3. 왜 지금 출시하나 — 3가지 타이밍 신호

DALL-E 2·3 서비스 종료 (2026년 5월 12일)

OpenAI는 DALL-E 2와 DALL-E 3를 2026년 5월 12일 완전히 종료한다고 발표했습니다. 현재 dall-e-3를 API로 호출하고 있는 서비스는 5월 12일 전에 마이그레이션을 완료해야 해요. GPT Image 2는 그 자연스러운 후계자 역할을 하게 됩니다.

Sora 서비스 종료로 GPU 확보 (2026년 3월 24일)

OpenAI는 Sora 비디오 생성 서비스를 3월 24일 종료했어요. 피크 시 하루 추론 비용만 1,500만 달러였지만, 전체 수명 동안 앱 매출은 210만 달러에 불과했거든요. 이때 확보된 막대한 GPU 컴퓨팅 자원이 GPT Image 2 학습과 대규모 그레이스케일 테스트에 재배치된 것으로 분석됩니다.

LM Arena 테스트 후 출시 패턴

OpenAI의 역사적 패턴을 보면 LM Arena 익명 테스트 이후 2~4주 내에 정식 출시하는 경우가 많았어요. 4월 4일 테스트를 기점으로 계산하면 4월 말~5월 중순이 가장 유력한 출시 시점입니다.

4, GPT Image 2 vs 현재 최강 Nano Banana Pro (Google)

현재 AI 이미지 생성 시장 최강은 구글의 Nano Banana Pro(Gemini 3 Pro Image)입니다. LM Arena 비교 기준으로 두 모델을 정리했어요.

항목GPT Image 2Nano Banana Pro
텍스트 렌더링~99%94%
생성 속도~3초약 5초
최대 해상도4K (4096×4096)4K (4096×4096)
세계 지식 / UI 복원우위보통
인물 사진 사실성보통우위
참조 이미지 활용미확인14장 지원
상업용 저작권 보호미확인지원
현재 사용 가능 여부미출시 (테스트 중)즉시 사용 가능

GPT Image 2는 텍스트 렌더링·속도·세계 지식에서 앞서지만, 인물 사진과 다중 참조 이미지에서는 아직 Nano Banana Pro에 밀립니다. 두 모델이 경쟁하는 3강 구도(GPT Image 2 + Nano Banana Pro + MAI-Image-2)가 형성될 전망이에요.

5. 지금 당장 준비할 것

GPT Image 2가 공식 출시되면 DALL-E 3에서 바로 마이그레이션이 필요합니다. API 파라미터 구조가 GPT Image 1.5와 호환돼서, 미리 준비해둔 팀이라면 출시 당일 모델 필드만 변경해 즉시 전환할 수 있어요.

지금 할 수 있는 것들이 있어요. ChatGPT에서 GPT Image 2를 이미 맛볼 수 있을 수도 있습니다. 프롬프트 끝에 Format 16:9를 추가해서 16:9 와이드 이미지가 나오고 텍스트가 선명하며 노란 색조가 없다면, A/B 테스트 그룹에 포함된 가능성이 높아요. 텍스트가 많은 포스터·인포그래픽·UI 스크린샷 이미지를 5~15회 연속 생성하면 새 모델에 연결될 확률이 높아집니다.

OpenAI 멀티모달 슈퍼 앱

GPT Image 2는 단순한 이미지 모델 업그레이드가 아닙니다. OpenAI의 멀티모달 슈퍼 앱 전략의 핵심 퍼즐이에요. GPT-5.5(추론) + GPT Image 2(이미지) + Codex(코드) + Atlas(브라우저) 조합이 완성되면, 텍스트·이미지·코드·웹 브라우징이 하나의 AI 플랫폼에서 모두 이루어지는 구조가 됩니다. AI 이미지 생성의 기준이 바뀌는 순간이 다가오고 있어요. DALL-E를 아직 쓰고 있다면 지금 바로 마이그레이션 계획을 세우세요.