OpenAI 가 답변 전에 내부적으로 '생각의 연쇄'(chain of thought) 를 여러 단계 거치는 추론 특화 모델 o1 을 공개했다. 수학·과학·코딩 벤치마크에서 GPT-4o 를 크게 앞섰다. 이후 'test-time compute 스케일링' 이 새 경쟁 축으로 자리잡았고, DeepSeek R1 과 Claude thinking mode 등이 같은 방향으로 나아간다.
OpenAI o1 — 추론 특화 모델의 등장
OpenAI 가 "생각하는 시간을 더 길게 쓰는" 추론 전용 모델 o1 을 공개했다.
출처 / 더 읽을거리
https://openai.com/o1/