NVIDIA·Google Cloud, 'Vera Rubin' 기반 A5X 인스턴스 공개 — 추론 비용 1/10로
Google Cloud Next 2026에서 NVIDIA·Google Cloud 가 차세대 'Vera Rubin' 아키텍처 기반의 A5X 인스턴스를 공개했다. 이전 세대 대비 토큰당 추론 비용을 10분의 1로, 메가와트당 처리량을 10배로 줄였다고 밝혔다. Gemini Enterprise Agent Platform 에 NVIDIA Nemotron 과 NeMo 프레임워크도 통합된다.
Google, 'Gemini 3.1 Flash TTS' 공개 — 70개 언어·다중 화자·감정 태그 지원
Google이 Gemini 3.1 Flash의 음성 합성(TTS) 전용 모델을 선보였다. Artificial Analysis TTS 리더보드 Elo 1,211로 업계 상위권에 올랐고, 70개 이상 언어와 다중 화자 대화, 자연어 톤·속도 제어를 지원한다. Google AI Studio·Vertex AI·Google Vids에서 이용 가능하다.