Market NewsIntroducing Gemma 4 12B: a unified, encoder-free multimodal model3 分鐘閱讀
Google DeepMind memperkenalkan Gemma 4 12B untuk AI multimodal pada komputer riba
Google DeepMind Blog melaporkan, Google DeepMind berkata Gemma 4 12B membawa kecerdasan multimodal agentic ke komputer riba, di antara model kecil edge dan sistem mixture-of-experts yang…
圖片來源: Google DeepMind Blog
Key Points
- Google DeepMind memperkenalkan Gemma 4 12B sebagai model pertengahan untuk komputer riba.
- DeepMind berkata Gemma 4 12B menggabungkan kecekapan mobile-first dengan penaakulan lanjutan.
- Sumber rasmi menerangkan model ini untuk kecerdasan multimodal agentic.
- Gemma 4 12B ialah model Gemma pertengahan pertama dengan input audio native.
Google DeepMind Blog melaporkan pada 4 Jun 2026 bahawa Google DeepMind memperkenalkan Gemma 4 12B, model pertengahan yang bertujuan membawa keupayaan AI multimodal berprestasi lebih tinggi terus ke komputer riba. Syarikat meletakkannya antara model 4B yang lebih mesra edge dan sistem 26B mixture-of-experts, jadi isyaratnya bukan sekadar model yang lebih besar.
Menurut sumber rasmi, Gemma 4 12B menekankan kecekapan mobile-first, penaakulan lanjutan dan kegunaan multimodal agentic. DeepMind juga berkata model ini ialah Gemma pertengahan pertama yang menyokong input audio native, menandakan hala tuju AI pada peranti tidak lagi terhad kepada teks.
Bagi pasukan yang membina pembantu AI, workflow peribadi atau pengalaman pada peranti, pelancaran ini menunjukkan local dan near-edge AI semakin relevan sebagai pilihan produk. Penilaian model perlu melihat saiz, sokongan modaliti, penggunaan memori dan jenis tugas secara bersama, bukan hanya membandingkan prestasi model cloud.
Kesan praktikalnya untuk syarikat ialah beberapa kerja dalaman, khidmat pelanggan, pemprosesan dokumen atau pengalaman offline boleh mula dipetakan semula. Soalan utamanya bukan hanya model mana paling kuat, tetapi tugas mana cukup selamat, cukup pantas dan cukup bernilai untuk dijalankan lebih dekat dengan peranti pengguna.
Sources
-
Introducing Gemma 4 12B: a unified, encoder-free multimodal model
An overview of Gemma 4 12B, a model designed to bring high-performance multimodal intelligence directly to your laptop.