AI Post

AI News

3 / 18 페이지

LaunchGemma2026.06.10

DiffusionGemma 공개 — GPU에서 기존 대비 4배 빠른 텍스트 생성 모델

구글이 텍스트 확산(diffusion) 기술을 적용한 실험적 오픈소스 AI 모델 'DiffusionGemma'를 공개했다. 기존의 순차적 토큰 생성 방식 대신 블록 단위로 텍스트를 동시에 생성해 GPU에서 최대 4배 빠른 속도를 달성하며, NVIDIA H100에서는 초당 1,000토큰 이상을 처리한다. 소비자용 GPU 18GB VRAM에서도 구동되며, Apache 2.0 라이선스로 Hugging Face에서 무료 공개된다.

출처: Google Blog
LaunchNorth Mini Code2026.06.09

Cohere, 오픈소스 경량 코딩 모델 North Mini Code 출시

Cohere가 2026년 6월 9일 개발자용 첫 에이전트 코딩 모델 North Mini Code를 오픈소스로 공개했다. 30B 파라미터(활성 3B) 혼합 전문가(MoE) 구조로, Apache 2.0 라이선스 하에 Hugging Face에서 무료로 내려받을 수 있다. 동급 모델 대비 최대 2.8배 높은 처리량을 제공하며 단일 H100 GPU로 실행 가능하다.

출처: Cohere Blog
LaunchClaude2026.06.09

Claude Fable 5 · Mythos 5 공개 — 역대 가장 강력한 Anthropic 기반 모델

Anthropic이 2026년 6월 9일 차세대 기반 모델 Claude Fable 5와 Mythos 5를 공개했다. Fable 5는 역대 일반 공개 모델 중 가장 강력한 성능을 자랑하며, 소프트웨어 엔지니어링·비전·지식 업무·과학 연구 전 분야에서 최고 벤치마크를 기록했다. 입력 100만 토큰당 $10, 출력 $50의 가격으로 전 플랫폼에 즉시 제공된다.

출처: Anthropic News