NVIDIA Nemotron 3 家族 — Nano Omni 与 Ultra
NVIDIA Nemotron 3 系列是 NVIDIA 从"卖铲人"向"模型提供者"扩展的核心开源模型产品线。
Nemotron 3 Nano Omni(2026-04-29)
NVIDIA 于 2026-04-29 发布 Nemotron 3 Nano Omni,开源多模态 MoE 模型。
规格
| 指标 | 数值 |
|---|---|
| 总参数 | 30B |
| 激活参数 | A3B |
| 上下文 | 256K |
| 模态 | 文本、图像、视频、音频、文档 |
关键特性
- 全模态覆盖:文本、图像、视频、音频、文档统一处理
- 专为 agentic 工作负载设计:不是通用聊天模型,而是 agent 基础设施
- 语音理解:基于 Parakeet 编码器,目前仅支持英语
- Open ASR 榜单 WER 5.95%
生态同日上线
OpenRouter、LM Studio、Ollama、Unsloth、fal、Fireworks、DeepInfra、Together、Baseten、Canonical 等在同日上线支持。
性能声称
多家主机商声称吞吐量为同类开源 omni 模型的约 9 倍。
战略意义
NVIDIA 从"卖铲人"向"模型提供者"扩展,用开源模型拉动硬件需求。Nemotron 3 Nano Omni 是 NVIDIA 首个 omni 版本,标志着其从纯基础设施向 AI 应用栈上层渗透。
Nemotron 3 Ultra(2026-06-02)
NVIDIA 在 Computex 上发布了 Nemotron 3 Ultra,被称为"目前最强的美国开源模型"。
技术规格:
- 550B-A55B 架构:总参数 550B,每 token 激活约 55B
- 稀疏度约 10%(相比之下 Kimi K2 / DeepSeek V4 约 3%),这影响了经济性和行为特征
- 在部分开放评测中已登顶
- 部分部署环境声称达到 300+ tok/s 的推理速度
- Artificial Analysis 得分 48,比 frontier 级模型低一档,大致与 MiniMax 2.7 同档
- 社区认为是"最强的美国开源权重模型"
与 Nano Omni 的对比:
| 维度 | Nano Omni | Ultra |
|---|---|---|
| 总参数 | 30B | 550B |
| 激活参数 | A3B | A55B |
| 上下文 | 256K | — |
| 模态 | 文本、图像、视频、音频、文档 | 文本(推测) |
| 定位 | 多模态 agent 基础设施 | 开源权重 LLM 标杆 |
战略意义
NVIDIA 从"卖铲人"向"模型提供者"扩展,用开源模型拉动硬件需求。Nemotron 3 系列覆盖了从边缘多模态(Nano Omni)到数据中心大模型(Ultra)的全谱系,标志着其从纯基础设施向 AI 应用栈上层的系统性渗透。