NVIDIA·Google Cloud, 'Vera Rubin' 기반 A5X 인스턴스 공개 — 추론 비용 1/10로

2026년 4월 22일 Google Cloud Next 행사에서 10년 이상 이어진 NVIDIA-Google Cloud 협업의 다음 단계가 공개됐다. 중심은 NVIDIA 의 차세대 GPU 아키텍처 'Vera Rubin' 을 탑재한 Google Cloud A5X 인스턴스다. 이전 세대 대비 '토큰당 추론 비용 1/10', '메가와트당 처리량 10배' 라는 구체적 숫자가 제시됐다.
플랫폼 레벨 통합도 함께 발표됐다. Google Distributed Cloud 에서 NVIDIA Blackwell·Ultra 기반 Gemini 모델을 미리보기로 제공하고, Gemini Enterprise Agent Platform 에는 NVIDIA Nemotron 모델과 NeMo 프레임워크가 기본 통합된다. 기업이 자사 데이터센터 안에서 Gemini 와 NVIDIA 스택을 동시에 쓸 수 있는 형태다.
보안·프라이버시 측면에서는 Confidential Computing 을 강화해 데이터가 암호화 상태로 추론되는 환경을 제공한다. 물리 AI·로보틱스 쪽도 챙긴다. NVIDIA Omniverse 와 Isaac Sim 이 Google Cloud Marketplace 에 공식 등재돼, 디지털 트윈·로봇 시뮬레이션 워크로드를 Google Cloud 에서 바로 구동할 수 있다.
초기 도입 고객으로 Snap, Schrödinger, Salesforce, CodeRabbit, Factory, Photoroom 등이 언급됐다. 커뮤니티 규모는 1년 동안 9만 명 이상의 개발자가 참여 중이라고 Google 이 밝혔다.
구글 서비스와 잘 붙는 멀티모달 AI.