Market NewsIntroducing Gemma 4 12B: a unified, encoder-free multimodal model3 分鐘閱讀
Google DeepMind memperkenalkan Gemma 4 12B untuk AI multimodal di laptop
Google DeepMind Blog melaporkan, Google DeepMind mengatakan Gemma 4 12B membawa kecerdasan multimodal agentic ke laptop, di antara model kecil untuk edge dan sistem mixture-of-experts yang…
圖片來源: Google DeepMind Blog
Key Points
- DeepMind mengatakan Gemma 4 12B menggabungkan efisiensi mobile-first dengan penalaran tingkat lanjut.
- Sumber resmi menyebut model ini dirancang untuk kecerdasan multimodal agentic.
- Gemma 4 12B disebut sebagai model Gemma menengah pertama dengan input audio native.
Google DeepMind Blog melaporkan pada 4 Juni 2026 bahwa Google DeepMind memperkenalkan Gemma 4 12B, model menengah yang ditujukan untuk membawa kemampuan AI multimodal berperforma lebih tinggi langsung ke laptop. Perusahaan memosisikannya di antara model 4B yang lebih ramah edge dan sistem 26B mixture-of-experts, sehingga pesannya bukan sekadar membuat model lebih besar.
Menurut sumber resmi, Gemma 4 12B menekankan efisiensi mobile-first, penalaran tingkat lanjut, dan skenario penggunaan multimodal agentic. DeepMind juga menyebut model ini sebagai model Gemma menengah pertama yang mendukung input audio native, sehingga arah produknya tidak hanya terbatas pada teks.
Bagi tim yang membangun asisten AI, workflow privat, atau pengalaman berbasis perangkat, rilis ini memberi sinyal bahwa local dan near-edge AI semakin relevan. Evaluasi model perlu melihat ukuran, modalitas, kebutuhan memori, dan jenis tugas secara bersamaan, bukan hanya membandingkan skor model cloud.
Implikasinya untuk perusahaan cukup praktis: sebagian tugas internal, layanan pelanggan, pemrosesan dokumen, atau pengalaman offline bisa mulai dipetakan ulang. Pertanyaannya bukan hanya model mana yang paling kuat, tetapi tugas mana yang cukup aman, cukup cepat, dan cukup bernilai untuk dijalankan lebih dekat ke perangkat pengguna.
Sources
-
Introducing Gemma 4 12B: a unified, encoder-free multimodal model
An overview of Gemma 4 12B, a model designed to bring high-performance multimodal intelligence directly to your laptop.