Skip to content
Back/AI Ecosystem

NVIDIA Nemotron 3 家族 — Nano Omni 与 Ultra

View in Graph
Updated 2026-06-03
1 min read
214 words

NVIDIA Nemotron 3 家族 — Nano Omni 与 Ultra

NVIDIA Nemotron 3 系列是 NVIDIA 从"卖铲人"向"模型提供者"扩展的核心开源模型产品线。

Nemotron 3 Nano Omni(2026-04-29)

NVIDIA 于 2026-04-29 发布 Nemotron 3 Nano Omni,开源多模态 MoE 模型。

规格

指标 数值
总参数 30B
激活参数 A3B
上下文 256K
模态 文本、图像、视频、音频、文档

关键特性

  • 全模态覆盖:文本、图像、视频、音频、文档统一处理
  • 专为 agentic 工作负载设计:不是通用聊天模型,而是 agent 基础设施
  • 语音理解:基于 Parakeet 编码器,目前仅支持英语
  • Open ASR 榜单 WER 5.95%

生态同日上线

OpenRouter、LM Studio、Ollama、Unsloth、fal、Fireworks、DeepInfra、Together、Baseten、Canonical 等在同日上线支持。

性能声称

多家主机商声称吞吐量为同类开源 omni 模型的约 9 倍

战略意义

NVIDIA 从"卖铲人"向"模型提供者"扩展,用开源模型拉动硬件需求。Nemotron 3 Nano Omni 是 NVIDIA 首个 omni 版本,标志着其从纯基础设施向 AI 应用栈上层渗透。

Nemotron 3 Ultra(2026-06-02)

NVIDIA 在 Computex 上发布了 Nemotron 3 Ultra,被称为"目前最强的美国开源模型"。

技术规格

  • 550B-A55B 架构:总参数 550B,每 token 激活约 55B
  • 稀疏度约 10%(相比之下 Kimi K2 / DeepSeek V4 约 3%),这影响了经济性和行为特征
  • 在部分开放评测中已登顶
  • 部分部署环境声称达到 300+ tok/s 的推理速度
  • Artificial Analysis 得分 48,比 frontier 级模型低一档,大致与 MiniMax 2.7 同档
  • 社区认为是"最强的美国开源权重模型"

与 Nano Omni 的对比

维度 Nano Omni Ultra
总参数 30B 550B
激活参数 A3B A55B
上下文 256K
模态 文本、图像、视频、音频、文档 文本(推测)
定位 多模态 agent 基础设施 开源权重 LLM 标杆

战略意义

NVIDIA 从"卖铲人"向"模型提供者"扩展,用开源模型拉动硬件需求。Nemotron 3 系列覆盖了从边缘多模态(Nano Omni)到数据中心大模型(Ultra)的全谱系,标志着其从纯基础设施向 AI 应用栈上层的系统性渗透。

Sources

Synthesized from 3 sources
  • AINews 2026-04-29Supporting source listed by this page.Whole pagemediumbody
  • 2026-06-03-00-07Supporting source listed by this page.Whole pagemediumabsorb log
  • 2026-06-02 [AINews] NVIDIA Cosmos 3, Nemotron 3 Ultra, and RTX SparkSupporting source listed by this page.Whole pagemediumabsorb log

Evolution

1 event
  1. absorbed

    Derived from source material

    This page is currently synthesized from 3 sources.

    From AINews 2026-04-29, 2026-06-03-00-07, 2026-06-02 [AINews] NVIDIA Cosmos 3, Nemotron 3 Ultra, and RTX SparkTo NVIDIA Nemotron 3 家族 — Nano Omni 与 Ultra
    Sources: raw/newsletters/AINews/2026-04-29 not much happened today.md · raw/briefing/AI Briefing/2026-06-03-00-07.md · raw/newsletters/AINews/2026-06-02 [AINews] NVIDIA Cosmos 3, Nemotron 3 Ultra, and RTX Spark.md

Linked from