Market NewsIntroducing Gemma 4 12B: a unified, encoder-free multimodal model3 分鐘閱讀
Google DeepMind, 노트북용 중형 멀티모달 모델 Gemma 4 12B 공개
Google DeepMind Blog에 따르면 Google DeepMind는 Gemma 4 12B가 노트북에서 에이전트형 멀티모달 AI를 구현하기 위한 중형 모델이라고 설명했다.
圖片來源: Google DeepMind Blog
Key Points
- 이 모델은 엣지 친화적인 4B 모델과 26B mixture-of-experts 시스템 사이에 위치한다.
- DeepMind는 Gemma 4 12B가 mobile-first 효율성과 고급 추론을 결합한다고 밝혔다.
- 공식 소스는 이 모델을 에이전트형 멀티모달 지능을 위한 모델로 설명한다.
- Gemma 4 12B는 네이티브 오디오 입력을 지원하는 첫 중형 Gemma 모델이라고 한다.
Google DeepMind Blog는 2026년 6월 4일 보도에서 Google DeepMind, 노트북용 중형 멀티모달 모델 Gemma 4 12B 공개에 대해 다음과 같이 설명했습니다. Google DeepMind가 Gemma 4 12B를 공개했다. 이 모델은 더 높은 성능의 멀티모달 AI를 노트북에서 직접 활용하도록 설계된 중형 모델이다. 회사는 이를 엣지 친화적인 소형 모델과 26B mixture-of-experts 시스템 사이에 위치시킨다.
공식 설명에 따르면 Gemma 4 12B는 mobile-first 효율성, 고급 추론, 에이전트형 멀티모달 사용 사례를 강조한다. DeepMind는 이 모델이 네이티브 오디오 입력을 지원하는 첫 중형 Gemma 모델이라고도 밝혔다.
AI 어시스턴트, 사내 워크플로, 기기 기반 경험을 검토하는 팀에는 중요한 신호다. local 또는 near-edge AI가 더 현실적인 제품 방향이 되고 있으며, 모델 평가에는 성능뿐 아니라 크기, 모달리티, 메모리 사용량을 함께 봐야 한다.
Sources
-
Introducing Gemma 4 12B: a unified, encoder-free multimodal model
An overview of Gemma 4 12B, a model designed to bring high-performance multimodal intelligence directly to your laptop.