Skip to content
Back/AI Ecosystem

Google Gemma 4

View in Graph
Updated 2026-06-04
2 min read
404 words

Google Gemma 4

Google Gemma 4 是 Google 迄今为止最智能的开源模型家族,于 2026 年 4 月发布,采用 Apache 2.0 许可证,标志着开源 AI 模型的重要里程碑。

核心特性

模型规格

模型 参数 特点 适用场景
E2B 2B (Effective) 边缘设备优化,128K 上下文 移动/IoT 设备
E4B 4B (Effective) 边缘设备优化,128K 上下文 移动/IoT 设备
26B MoE 26B (3.8B active) 延迟优化,MoE 架构 笔记本/工作站
12B Dense 12B 消费级硬件本地运行,平衡能力与成本 笔记本/台式机
31B Dense 31B 原始质量最大化 高性能计算

性能表现

  • Arena AI 文本排行榜:31B Dense 模型排名第 3,超越参数规模大 20 倍的竞争对手
  • 12B 本地部署定位:Jeff Dean 于 2026 年 6 月推介 12B 版本,强调其可在消费级硬件直接运行,无需专用 GPU 集群
  • 智能密度 (Intelligence-per-parameter):通过架构优化,小模型实现大模型能力
  • 上下文窗口:边缘模型 128K,大型模型 256K

多模态与语言支持

  • 全模态支持:所有型号原生支持视频、图像处理;E2B/E4B 还支持音频输入
  • 语言支持:140+ 语言原生训练
  • Agentic 原生:内置函数调用、结构化 JSON 输出、原生系统指令支持

许可证与采用

Apache 2.0 的战略意义

Google 放弃了之前限制性的许可条款,采用 Apache 2.0 许可证。这为企业采用和模型定制提供了法律确定性,可能加速 Gemma 在企业场景的渗透。

生态系统支持

首日支持主流工具:

  • Hugging Face
  • Ollama
  • vLLM
  • llama.cpp
  • MLX
  • NVIDIA NIM

社区数据

  • 下载量:超过 4 亿次
  • Gemmaverse:超过 10 万个变体

12B Dense:Encoder-Free 多模态本地模型(2026-06-04)

来源:Ben's Bites 2026-06-04、[[raw/newsletters/AINews/2026-06-04 [AINews] Reve 2 and Ideogram 4 Layouts in Imagegen.md|AINews 2026-06-04]]

Google 于 2026 年 6 月推介 Gemma 4 12B,定位为 E4B 和 26B MoE 之间的桥梁:

  • 统一无编码器架构:直接集成音频和视觉输入,无需单独编码器,减少延迟和内存使用
  • 性能接近 26B MoE:在多项基准上接近更大模型的表现
  • 笔记本就绪:可在 16GB RAM 的消费级笔记本上本地运行,内存占用不到 26B 模型的一半
  • 多模态输入:原生图像输入 + 原生音频输入,是 Google 首个中型音频输入模型
  • 部署选项:LM Studio、Ollama、Google AI Edge Gallery App、Hugging Face、Kaggle、llama.cpp、MLX、SGLang、vLLM、Unsloth
  • 量化后可在 8GB RAM 运行(社区验证)

架构意义:无编码器设计消除了传统多模态模型中独立的视觉/音频塔,将模态编码器折叠到 LLM 骨干网络,简化了架构并可能提升效率。社区反应集中在这一设计的优雅性上。

战略影响

开源模型的新定位

Gemma 4 的发布标志着开源模型不再只是复制闭源模型,而是在定义新标准。Apache 2.0 许可证选择表明 Google 愿意在开放生态上投入资源。

对开发者的意义

  • 成本控制:本地运行成本比 API 调用低 5-21 倍
  • 隐私合规:本地处理有助于满足 GDPR、HIPAA 等要求
  • 供应商解耦:避免绑定单一云服务商
  • 定制能力:支持 fine-tuning 以满足特定业务需求

相关概念

来源

Sources

Synthesized from 4 sources

Evolution

1 event
  1. absorbed

    Derived from source material

    This page is currently synthesized from 4 sources.

    From 2026-06-04-18-13, 2026-06-04 Build tools to build more, 2026-06-04 Build tools to build more, 2026-06-04 [AINews] Reve 2 and Ideogram 4 Layouts in ImagegenTo Google Gemma 4
    Sources: raw/briefing/AI Briefing/2026-06-04-18-13.md · /Users/jean/Documents/Obsidian Vault/raw/newsletters/Ben's Bites/2026-06-04 Build tools to build more.md · raw/newsletters/Ben's Bites/2026-06-04 Build tools to build more.md · raw/newsletters/AINews/2026-06-04 [AINews] Reve 2 and Ideogram 4 Layouts in Imagegen.md

Linked from