앤트로픽이 Claude 3.5 Sonnet 을 공개했다. 코딩·수학·추론 벤치마크에서 OpenAI 의 GPT-4o 보다 앞선 수치를 기록했고, 특히 코드 생성 능력이 개발자들 사이에 큰 반향을 일으켰다. 이 시점부터 "어떤 LLM 이 제일 똑똑한가" 가 매월 바뀌는 치열한 경쟁 체제가 본격화됐다.
Claude 3.5 Sonnet — 본격적인 LLM 순위 경쟁 시작
앤트로픽이 새 모델을 내고 여러 벤치마크에서 GPT-4o 를 능가한다고 발표했다.