Google Gemma 4
Google Gemma 4 是 Google 迄今为止最智能的开源模型家族,于 2026 年 4 月发布,采用 Apache 2.0 许可证,标志着开源 AI 模型的重要里程碑。
核心特性
模型规格
| 模型 | 参数 | 特点 | 适用场景 |
|---|---|---|---|
| E2B | 2B (Effective) | 边缘设备优化,128K 上下文 | 移动/IoT 设备 |
| E4B | 4B (Effective) | 边缘设备优化,128K 上下文 | 移动/IoT 设备 |
| 26B MoE | 26B (3.8B active) | 延迟优化,MoE 架构 | 笔记本/工作站 |
| 12B Dense | 12B | 消费级硬件本地运行,平衡能力与成本 | 笔记本/台式机 |
| 31B Dense | 31B | 原始质量最大化 | 高性能计算 |
性能表现
- Arena AI 文本排行榜:31B Dense 模型排名第 3,超越参数规模大 20 倍的竞争对手
- 12B 本地部署定位:Jeff Dean 于 2026 年 6 月推介 12B 版本,强调其可在消费级硬件直接运行,无需专用 GPU 集群
- 智能密度 (Intelligence-per-parameter):通过架构优化,小模型实现大模型能力
- 上下文窗口:边缘模型 128K,大型模型 256K
多模态与语言支持
- 全模态支持:所有型号原生支持视频、图像处理;E2B/E4B 还支持音频输入
- 语言支持:140+ 语言原生训练
- Agentic 原生:内置函数调用、结构化 JSON 输出、原生系统指令支持
许可证与采用
Apache 2.0 的战略意义
Google 放弃了之前限制性的许可条款,采用 Apache 2.0 许可证。这为企业采用和模型定制提供了法律确定性,可能加速 Gemma 在企业场景的渗透。
生态系统支持
首日支持主流工具:
- Hugging Face
- Ollama
- vLLM
- llama.cpp
- MLX
- NVIDIA NIM
社区数据
- 下载量:超过 4 亿次
- Gemmaverse:超过 10 万个变体
12B Dense:Encoder-Free 多模态本地模型(2026-06-04)
来源:Ben's Bites 2026-06-04、[[raw/newsletters/AINews/2026-06-04 [AINews] Reve 2 and Ideogram 4 Layouts in Imagegen.md|AINews 2026-06-04]]
Google 于 2026 年 6 月推介 Gemma 4 12B,定位为 E4B 和 26B MoE 之间的桥梁:
- 统一无编码器架构:直接集成音频和视觉输入,无需单独编码器,减少延迟和内存使用
- 性能接近 26B MoE:在多项基准上接近更大模型的表现
- 笔记本就绪:可在 16GB RAM 的消费级笔记本上本地运行,内存占用不到 26B 模型的一半
- 多模态输入:原生图像输入 + 原生音频输入,是 Google 首个中型音频输入模型
- 部署选项:LM Studio、Ollama、Google AI Edge Gallery App、Hugging Face、Kaggle、llama.cpp、MLX、SGLang、vLLM、Unsloth
- 量化后可在 8GB RAM 运行(社区验证)
架构意义:无编码器设计消除了传统多模态模型中独立的视觉/音频塔,将模态编码器折叠到 LLM 骨干网络,简化了架构并可能提升效率。社区反应集中在这一设计的优雅性上。
战略影响
开源模型的新定位
Gemma 4 的发布标志着开源模型不再只是复制闭源模型,而是在定义新标准。Apache 2.0 许可证选择表明 Google 愿意在开放生态上投入资源。
对开发者的意义
- 成本控制:本地运行成本比 API 调用低 5-21 倍
- 隐私合规:本地处理有助于满足 GDPR、HIPAA 等要求
- 供应商解耦:避免绑定单一云服务商
- 定制能力:支持 fine-tuning 以满足特定业务需求
相关概念
- AI Ecosystem Overview
- Harness Engineering
- 本地优先 AI 策略
- Claude Code
来源
- 2026-04-11 No Claude for Claws (via newsletter skill)
- 2026-04-07 No Claude for Claws — 首周下载量突破 200 万
- 2026-04-07 Gemma 4 crosses 2 million downloads — 本地部署标杆,生态系统协调战
- [[raw/newsletters/ainews/2026-04-05 [AINews] Good Friday.md|2026-04-05 [AINews] Good Friday]] — Apache 2.0 许可证意义,本地运行性能数据
- Ben's Bites 2026-06-04 — 12B encoder-free 架构细节
- [[raw/newsletters/AINews/2026-06-04 [AINews] Reve 2 and Ideogram 4 Layouts in Imagegen.md|AINews 2026-06-04]] — 12B 本地部署与社区反应
- 2026-04-03 Gemma 4 The best small Multimodal Open Models — 架构创新详解,Day-0 生态支持
- Gemma 4 官方博客