设为首页加入收藏
  • 首页
  • {$vo.typename}
  • {$vo.typename}
  • {$vo.typename}
  • {$vo.typename}
  • {$vo.typename}
  • {$vo.typename}
    • 当前位置:首页>珠海>黄仁�分钟对话实录:万亿美元这么赚!谈中国、H200、养虾、Groq,炮轰DLSS 5批评者

      黄仁�分钟对话实录:万亿美元这么赚!谈中国、H200、养虾、Groq,炮轰DLSS 5批评者

      发布时间:2026-03-19 来源:漫不经意网作者:dage1234

      智东西作者 Zer0 陈骏达编辑 心缘

      智东񕻹�日圣何塞现场报道,在昨日发表GTC主题演讲后,今天,英伟达创始人兼CEO黄仁勋与智东西等全球媒体进行了长达񙸬小时的深度交流,连续回�问,并透露面向中国市场的H200 GPU重启生产,已收到许多订单。

      黄仁勋对昨日英伟达GTC演讲中的重磅发布做了许多补充解读,包括解释说昨天撂出的重磅预言“�年收񒔧万亿美元订单”,仅仅包含Blackwell和Vera Rubin两条产品线,还没算上独立CPU、Groq、存储及网络设备。

      和全球媒体沟通过程中,黄仁勋也展示了自己颇有“活人感”的几个侧面。当知名汽车媒体Motor Trend在现场宣布黄仁勋为年度人物时,他显得十分开心,不仅扬言要“站在这里直到再多拿几个奖”,还幽默地向全场“忏悔”,笑称自己其实已经两年没摸过方向盘,全靠自动驾驶代步,言语间难掩骄傲与笑意。

      而当采访突然被一阵突兀的手机铃声打断时,他毫不客气地中断了回答,当场“抓包”并抛出自己的铁律:“开会时所有手机必须静音,不振动、不响铃,彻底静音,这点英伟达人人都知道。”他甚至在台上静静等候对方处理完毕,半开玩笑半认真地说到:“我在等你呢。”将他对身边一切的绝对掌控感与不加掩饰的真性情,展露得淋漓尽致。

      以下是黄仁勋GTC采访的核心内容:

      1、200亿美元收购Groq:Groq之于英伟达,就如同Mellanox之于英伟达。Groq的LPU并非为了替代现有产品,与Vera Rubin结合后才能应对新兴的推理细分市场。

      2、Vera CPU:这些CPU与传统x86 CPU截然不同,未必适用于所有场景,其核心价值在于�亿美元的CPU,支�亿美元的GPU跑满性能。

      3、存储芯片:英伟达目前拥有数据中心中唯一一个同时针对HBM、LPDDR、SRAM三种存储技术进行优化的架构,他们还在与每一家内存厂商合作。

      4、AI不会杀死SaaS:以EDA软件为例,AI并非从零开始凭空生成晶体管,英伟达工程师也不是像在用Nano Banana生图一样设计芯片,而是一层一层地精确构建。

      5、AI安全:用科幻小说式的AI叙事去恐吓所有人是一种傲慢和自大。AI智能体系统像“白细胞”一样参与网络安全,当入侵者来袭时可以立即响应并蜂拥而至,展开反击。

      6、OpenClaw爆火:OpenClaw是后推理时代AI的转折点,“市场对一个精心设计的开源智能体系统,存在着真正且长期被压抑的迫切需求”。

      7、H200进入中国:“英伟达已获得向中国众多客户销售H200的许可证,也已经收到了来自众多客户的采购订单,正处于恢复生产的过程之中。”

      8、1万亿美元营收:此前预测的�𻂉万亿美元营收,仅仅包含了Blackwell和Vera Rubin两条产品线。如果加上独立CPU、Groq、存储以及网络设备,规模可能会达𳗡.25万亿美元。

      9、投资背后逻辑:英伟达只向那些他们相信会成功的公司提供融资,瞄准的是“下一个谷歌”、“下一个Meta”、“下一个亚马逊”。其本质是在投资生态,这是极佳的投资标的。

      10、如何理解英伟达:英伟�%的业务任何云服务商都无法独立覆盖,剩�%是云业务,其�%~50%的需求由英伟达创造,比如没有英伟达甲骨文就没法服务OpenAI,最后才是云服务商自身的需求。

      11、DLSS 5争议:对DLSS 5的批评完全错误,开发者依然可以对生成效果进行微调。一切主动权都在开发者手中。英伟达在创造的是技术,而非艺术。

      12、机器人:推理能力的突破和VLA(视觉-语言-动作)模型的应用,已经给机器人的认知问题提供解决方案。剩下的主要是工程优化,未来三年内机器人技术将迎来重大突破。

      13、自动驾驶:英伟达自动驾驶业务目前约占总营收񊄩%,但英伟达最初做的几乎每一件事,比如CUDA、可编程着色器、光追都耗费了大量资金,却毫无回报,甚至引来不少质疑。必须坚信自己所相信的,然后决定是否值得继续追求。

      14、AI时代的职场与人类未来:AI不会导致大规模失业,人类反而会更忙。关于人类,唯一可以确定的是:我们如今允许自己打开想象力去解决的问题,比四年前多出了百万倍。

      15、黄仁勋分享“人生三诀”:别被开除,别无聊,别死。对人如此,对公司也一样。

      以下是采访的完整实录:

      Q1:英伟达花了创纪录�亿美元收购了Groq,这是你们历史上最大的一笔交易。因为Groq的LPU解决了你们GPU在规模化实时推理上的问题。这是否意味着业内已经认识到AI的重心已经从训练转向推理了?

      黄仁勋:首先,你面前站着的是“推理之王”。我可以这么说,(因为)有人曾封我为“推理之王”。2025年,我们决定将巨额资源投入到推理领域。�年�年初,我们推出了NVLink 72系统,推出了NVFP4(英伟达Blackwell GPU架构引入񊄬位浮点格式),在此之前还推出了Dynamo(英伟达的开源、低延迟、模块化推理框架)。

      Dynamo几乎提前两年诠释了我昨天才公布的完整战略。在那之前,我们就已经知道推理在NVLink 72上表现完美,这就是NVLink 72如此重要的原因。35倍的性能提升,成本只有原来񊄩/50。或者说每瓦性能提升�倍,成本只有原来񊄩/35。

      因此,我们目前是成本最低的token生产商,也是AI工厂中吞吐量最高的token生产商。这一切,都归功于NVFP4、NVLink 72与Dynamo的协同作用。

      随着市场持续演进,我昨天提出的核心概念之一就是:并非每个token都是等价的——每个token可能由小型模型、较大模型或超大型模型生成,对应的输入上下文长度也从极短到极长不等。

      在每个细分领域,AI都在变得越来越智能。

      AI发展初期,ChatGPT只有一个服务层级——免费档,随后推出了每�美元的付费档,o1和o3问世后,又新增了更高的服务层级。这些层级本质上就是产品的细分市场在不断扩大,催生了差异化需求。现在有开发者在使用AI智能体,比如Claude Code和Codex,它们极具实用价值,由此形成了又一个新的服务层级。

      这和英伟达当年只有RIVA 128一款产品的起步阶段并无二致。如今我们拥有RTX 5090、5080、5070、5060……各类产品一应俱全。就如同iPhone现在拥有众多不同版本,覆盖不同层级——因为客户群体各异,需求不同,价格定位也不同。我们一直在沿着这一产品谱系全面拓展布局。

      就目前token的主流消耗场景而言,现有的Grace Blackwell以及即将到来的Vera Rubin,其性能都无可匹敌,Groq的加入不会改变这一格局。

      然而,我们判断一个新兴细分市场正在形成——该市场要求模型同时满足三个条件:模型体量大、上下文长度长,以及推理延迟极低,也就是响应速度极快。

      Groq可以兑现上述三项承诺中的一项,但无法同时满足全部三项。将Vera Rubin与Groq结合,我们便能同时实现这三项承诺,由此开辟出一个新的细分市场:大模型+长上下文+超快token生成速率。这正是我们所设想的市场细分方向,也是引入Groq的战略意图。

      我依然认为,在一座算力工厂的配置中,75%仍将是纯Vera Rubin部署;另�%将是Vera Rubin与Groq的组合部署。Vera Rubin仍将是核心。它实在太强了——我们自己都不知道如何超越Vera Rubin,否则我们早就造出能胜过它的产品了。

      Grace Blackwell是当下的推理之王;明日,Vera Rubin将接过这一王冠。不久的将来,Grace Blackwell终将成为历史,而Vera Rubin,乃至未来更新的版本,将登顶推理算力之巅。

      我希望Groq之于英伟达,就如同Mellanox之于英伟达一样,是一次架构层面的重要补充。我们构建的不是一块GPU,而是一座AI工厂。

      Q2:英伟达越来越多地被要求为客户的数据中心建设提供融资支持。请问这类融资安排的具体形式是怎样的?英伟达又将如何管理其中的风险?

      黄仁勋:我们只向那些我们相信会成功的公司提供融资。

      我们投资了CoreWeave、Nscale和Nebius,我认为我们完全可以承认,这些都是全垒打级别的投资。我们之所以有把握认定这些是必胜之局,是因为我们已经看到了流向它们的业务。从很多层面来说,我们掌握着先手信息。

      我们通过帮助它们更快、更大规模地扩张来投资整个生态系统。由于我们清晰地看到了它们面前的业务与机遇,风险实际上极低。这对于流向它们的算力需求来说,也是一种极大的服务价值。如大家所知,其中一些客户就是Meta、Azure、Anthropic等巨头。

      我们并非在为所有庞大的市场需求寻找产能,而是通过相关投资切实帮助到每一方。因此,我们以“超级助推器”的角色参与其中。

      即便没有我们,他们也能完成融资,但这对我们而言是融入整个生态系统的绝佳方式,坦率地说,迄今为止也是一项非常出色的投资。

      Q3:随着OpenClaw和NemoClaw的推出,哪类问题是您个人最期待这些工具帮助大家解决的,或者是以前难以实现的任务?

      黄仁勋:我最期待的是,自动驾驶汽车无需积累数十亿英里的训练里程就能实现安全行驶。如今,我们拥有具备推理能力的AI,使汽车能够对某一特定场景进行真正意义上的推理,并将其分解为一系列相对平常的子场景。

      一个复杂的驾驶场景,其实往往是你曾经经历过的情况的变体,只是把某个球换成了别的物体,把一只猫换成了一条狗,把一个行人换成了一位骑行者。本质上都是同类场景的分解重组。

      采用同一推理技术的智能汽车,将带动机器人技术在未来几年内实现超高速演进。由于推理系统的突破,物理AI将迎来令人惊叹的加速发展。

      具备推理能力的蛋白质生成技术将能够生成更多基于物理结构的蛋白质,这些蛋白质更具现实可行性、更易于合成,毒性也更低。因为AI能够对所有这些特性进行推理。这在短短几年前还是完全不可能实现的。

      我认为,o1,即OpenAI o1,是推理系统发展史上真正的重要拐点,OpenAI在这一领域的工作理应获得高度的认可。

      OpenClaw是后推理时代AI的转折点。如果说ChatGPT将生成式AI带给了世界,那o1则将推理系统带给了世界。

      Claude Code长期以来主要面向企业级应用,因此大多数人尚未真正体验过智能体系统——除了我们这些身处软件开发行业的人。我们正在尽情享受这项技术带来的红利,公司所有的软件工程师如今都有智能体协同工作。但这种体验仅限于企业内部,局限于科技行业,尚未向大众开放。

      突然之间,OpenClaw横空出世。我们终于拥有了一个真正架构精良的开源智能体系统。它面临的唯一挑战是安全性——安全并非唯一的难题,但确实是一个极其严峻的问题。安全、治理、隐私,以及所有与规范化智能体系统相关的特性,都是亟待解决的关键议题。

      我们可以与Peter(OpenClaw创始人)合作,将这些功能整合进OpenClaw。同时,我们还通过一系列运行时和参考设计来完善OpenClaw,使其即使采用开放模型,也能帮助企业实现极致性能。我们称之为NemoClaw。

      NemoClaw本质上就是OpenClaw,外加大量深度集成的英伟达技术——基本上是一份经过英伟达优化、专为企业级场景打磨的OpenClaw蓝图。如今只需一行代码、一键安装,每个人都能获得一个强大的智能引擎。我认为这完全是革命性的突破。

      回过头来看,OpenClaw在短短几周内就成为史上最受欢迎的开源项目之一,而Linux可是花�年才达到今天的地位——这是一项非常非凡的成就。

      它表明全球对此抱有极大的兴趣,也揭示了对一个精心设计的开源智能体系统存在着真正潜在且长期被压抑的迫切需求。现在,每个人都可以制定自己的智能体战略了。这意义重大,我感到非常兴奋。

      Q4:昨天DLSS 5发布了,游戏社区中有些相当强烈的反对声音,认为这项技术让许多游戏看起来更糟糕、千篇一律,或者只能在视频中观看。你对这种批评怎么看?

      黄仁勋:首先,他们完全错了。原因在于,我已经详细解释过了,DLSS 5将几何形状、纹理等游戏元素的可控性与生成式AI相结合。开发者依然可以对生成式AI进行微调,使其符合自身的艺术风格。

      一切主动权都在开发者手中。我们创造的是技术,而非艺术。

      DLSS 5以几何体信息为控制基础,以游戏的真实渲染结果(Ground Truth)为条件约束,在其上叠加并增强了生成式能力,但并不影响艺术家的控制权。它不是帧级别的后处理,而是几何级别的生成控制。

      生成的所有内容游戏开发者都可以微调。我们展示这项技术,是为了让开发者看看它能做什么。如果开发者想让它变成卡通风格、色调分离,或者玻璃质感,或者任何风格,都能做出来。这些都直接由游戏开发者控制。

      这与纯粹的生成式AI截然不同。这是内容受控的生成式AI。这正是我们将其命名为神经渲染的原因。

      Q5:您谈到了Groq,并表示不会出现市场蚕食效应。但既然我们拥有了这些新产品,是否会形成不同的收入流,让我们对那个“1万亿美元+”的数字有更清晰的了解?第二个问题是关于股票回购的。

      黄仁勋:񙹻万亿美元,是我们目前基�年前的采购订单所能看见,并对之充满信心的数字,且仅涵盖Blackwell和Vera Rubin两条产品线。问题在于,为何我只纳入这两项。

      尽管英伟达现在还销售独立CPU,那将是一项数十亿美元规模的业务。Groq自身业务可能翻倍,因此,对于一𰶥GW的数据中心,Groq可将英伟达的整体收益提升�%。

      因此,从理论上说,非实际数字,仅为理论推演,񙹻万亿美元有望达𳗡.25万亿美元。

      我同样未将存储系统纳入计算。如大家所知,KV Cache的规模已极为庞大,AI使用存储系统的速度远超人类,因此存储系统的性能必须大幅提升。

      这正是我们推进STX存储机架等项目的原因所在,一切都是为了彻底重构面向AI的存储系统。戴尔展示了集成英伟达全套技术的AI数据平台,整个存储行业都将跟随我们的方向演进。

      为什么我只使用Blackwell和Vera Rubin的营收数据?原因非常简单:去年在GTC上,我曾预测Blackwell加Vera Rubin�年的规模�亿美元。若𹠽万亿的口径调整为包含CPU、Groq和存储,则无法与此前�亿美元作横向对比。

      然而,这对外界理解񙹻万亿美元制造了混乱——因为英伟达今天已提供远比以前更多的产品,大家不禁会问:这是否意味着Blackwell加Vera Rubin不𳗡万亿?恰恰相反,实际数字只会更高。

      1万亿美元,仅仅代表Blackwell加Vera Rubin,仅统计�年。不含独立CPU,不含Groq,不含存储,不含BlueField DPU,不含Vera Rubin Ultra,不含Feynman,不含Feynman Next,一律不包含,仅限Blackwell加Vera Rubin。

      而距�年底还�个月,这意味着最终数字大概率将超񙷇万亿美元。

      好的,第二个问题,我们显然正在产生规模极为庞大的自由现金流。与此同时,英伟达的增长也非常之快,增速本身在加快,而不仅仅是绝对数字在增长。上个季度是我们有史以来营收规模最大的季度,同时我要强调,增速也仍在加快。

      因为我前面所阐述的一切业务,这种双重增长得以实现,我们将产生大量现金流。

      这些现金首先是支撑业务增长的必要资本。我们有大量供应商和合作伙伴,采购、产能保障、库存锁定,这一切都需要资金,这是第一优先级的资本用途。

      第二,我们投资生态系统。生态系统是极佳的投资标的,坦率说,我认为这就是计算产业的未来。我们正在投资“下一个谷歌”、“下一个Meta”、“下一个亚马逊”。

      围绕CUDA构建的生态系统是我们的第二项核心工作,即便如此仍能保留充裕的自由现金流。我们在上次会议中表示,计划在本财年通过回购和分红的方式向股东返�%的自由现金流。也就是说,2026财年的股东回报将达到自由现金流�%。

      去年的自由现金流规模不及今年,分配比例大约�%左右。今年,在更大的基数之上,我们将进一步提高分配比例。因此,答案是——这将会是一个非常可观的数字。

      关于具体的收入流,我认为这并不是我们的运作方式。原因在于:NVLink交换机只搭配英伟达的计算产品使用,Spectrum-X也是专门针对特定场景设计的,总体而言有其内在逻辑,但我可以换一个维度来拆解。

      我在主题演讲中已经谈到这一点。大多数人忘记了,英伟达的业务远比一家芯片公司多元化得多。原因在于我们是全栈公司,能够帮助各方在任何地点构建AI工厂。戴尔之所以表现得如此出色,是因为他们对此立场清晰、态度坦诚,英伟达AI工厂正在全球各地加速落地建设,增速持续加快。

      我们也在不同国家的园区建设AI工厂。除非你能交付完整的AI工厂,否则这些客户不会购买芯片,他们没有软件能力,你必须是一家全栈公司才能服务他们。

      ▲英伟达在采访现场展示全系列产品

      因此,我们�%的业务,无论是企业、工业、物理AI、自动驾驶、机器人,还是各地区的NCP部署,或者主权AI,这些场景,任何云服务商都无法独立覆盖。这些客户购买的不是芯片,而是平台。

      我�%的业务规模相当可观,且完全不属于云业务。

      第二部分是云业务。其中一部分是我们直接销售给云服务商的,但另一部分,他们对我们来说本质上相当于戴尔的角色,也就是说,终端客户是通过云平台使用我们的产品。我们为他们带来了客户,因为这些客户是CUDA开发者。

      举个例子,如果没有英伟达,OCI(Oracle云基础设施)如何能服务OpenAI?OpenAI的整个技术栈都构建于此。正是我们将OpenAI引入了OCI。

      类似的例子还有很多,如果不是因为Anthropic今年将全面构建于英伟达之上,我们又怎能将Anthropic引入Azure?这将形成一个极其庞大的生态基础。能理解吗?因此,我们在CSP(云服务提供商)中的很大一部分业务,实际上是由英伟达主动创造的。

      所有CSP对此心知肚明。我们与他们建立了深度的营销合作关系和业务合作关系,由英伟达为他们引流客户。我昨天展示了大量案例。

      我�%的业务,纯芯片公司无法服务,云服务商也无法独立服务。剩�%的业务中,大�%~50%实际上是英伟达主动创造的业务,其余才是云服务商自身的内部消耗需求。

      Q6:我们是不是已经迎来拐点,到达了机器人领域的ChatGPT时刻?请问在您看来,人类与能力出众的机器人之间,最难攻克的未解难题是什么?

      黄仁勋:如果你只是列出当今机器人存在的问题,那清单会相当长,但它们都只是工程问题。事实上,你能看到它们四处走动。

      (突然有手机铃声响起,黄仁勋回答被打断)

      黄仁勋:是谁的手机?我没有太多忌讳,但有一条——开会时所有手机必须静音。每一位英伟达员工都清楚这一点:不振动、不响铃,彻底静音。我在等你呢。

      (等了一会儿后继续)

      这些机器人已经开始能够完成一些任务。一旦一项技术的可行性得到验证,优化往往不超过五年。因此我非常确信,三年之内,你将看到能力极为出色的机器人。

      由于我们已同步攻克了认知AI,也就是AI认知领域的OpenClaw。OpenClaw在机器人内部运行,这一设想已经相当显而易见。

      此外还有VLA(视觉-语言-动作)模型,负责控制机器人的运动与关节协调。尽管仍有诸多挑战,但系统一与系统二的AI问题,正在被实时解决。

      因此,我认为三年内,你将见证真正意义上的重大突破。

      Q7:正如您所说,1万亿美元是完全可能实现的,同时也对制造产能提出了巨大需求。结合台积电、三星等厂商的现状,您如何看待未来五年全球半导体制造产能的前景?

      黄仁勋:我们将需要大量的制造产能,且不会大量使用ASIC专用芯片。我们是目前数据中心中唯一一个同时针对三种存储技术进行优化的架构:HBM、LPDDR、SRAM。

      目前,其他数据中心CPU均采用DDR内存,但其带宽能效相当低下。英伟达率先在Grace CPU中引入了LPDDR4,这是一次革命性的突破。

      我认为再过几年,业界都将跟进。大家现在都意识到这是一个多么正确的决策。Vera CPU采用LPDDR5,Rosa CPU采用LPDDR6。

      我们现在拥有完善的LPDDR技术路线图。AI运行需要大量内存,它必须依靠短期记忆、工作记忆和长期记忆来思考。因此,内存是AI体系中极其重要的组成部分。

      当然,互连同样关键。我们在纵向扩展(Scale-up)和横向扩展(Scale-out)两个维度同步推进,系统规模持续扩大,需要大量产能支撑。

      世界仍在学习这样一个概念:传统意义上,计算机主要用于数据录入和数据检索。大家注意,人类通过键盘输入。这是使用计算机的旧方式。

      未来,计算机实际上是一台“制造机”:一个token生产系统,而当前全球专用于token生产的计算机规模极为有限。之所以如此有限,是因为迄今为止我们出货的大多数系统仍被用于训练。

      如今,推理的拐点已经到来,OpenClaw横空出世,智能体系统正在各处广泛应用。用于推理的token生产规模才刚刚起步。我们究竟需要多少算力投资?我认为需要数万亿美元量级的产能。

      因此,我认为晶圆代工厂将会极度繁忙。我们很荣幸与台积电合作,毫无疑问,这是世界上最顶尖的代工厂。我们还与三星合作。由于我们对内存的消耗量极大,我们与每一家内存厂商合作,并将与每一家连接器厂商、每一家硅光子公司携手共进。

      Q8:AI的应用场景可以说不计其数,我们甚至还未能全部预见。但有一个话题直到最近才真正引发深入讨论:我们不希望AI做什么?我很好奇——在您看来,有哪些领域是AI不应进入的,甚至是永远不应涉足的?

      黄仁勋:自主能力总会有一个范围。我的电饭煲在某种程度上是自主的,今天的无人机在某种程度上也是自主的。面对这些事物的范围,我们需对所追求的功能本身保持更多审慎与反思。

      AI不应该违法。AI不应该承诺提供它没有的功能。例如,如果一辆车说它能�英里每小时的速度安全驾驶,我们希望它不会�英里时就爆炸。这些都是人类在长期实践中总结出的极具常识性的准则。

      至于其他方面,我认为我们应当持续学习,对自己的认知边界保持更多谦逊。

      用科幻小说式的AI叙事去恐吓所有人,在我看来是一种傲慢,过于自大了。我更倾向于在探索中前行,而非以恐惧驱动他人。

      提醒人们是一回事。吓唬人们是完全不同的事。在剧院里有些话不能说,在飞机上也有些话不能说。人类的判断力会告诉我们,”提醒”与”恐吓”之间存在本质区别。

      我有我自己的观点,但最终分析下来,我们需要AI为我们做很多伟大的事情。

      例如,我们需要AI智能体系统参与网络安全。我们希望企业被“白细胞”所守护,以防有入侵者。网络安全智能体可以立即响应并蜂拥而至,攻击入侵者,就像白细胞一样。

      任何其他分析AI和网络安全的方式对我来说都不合逻辑,因为未来,网络安全威胁的演变越来越快,我需要超高速的AI智能体来保护我。

      我认为这是一个完美的例子,没有人不想要白细胞。白细胞本质上是攻击性细胞,它们主动出击,那是好事。让我们保持安全。

      Q9:我们正在进入一𰶧D模拟世界。我刚刚体验了英伟达的仿真器演示,你认为这𰶧D模拟世界未来几年会如何发展?

      黄仁勋:刚才那位朋友问了我一个相反的问题:DLSS 5是用生成式AI来增𻡇D图形的,而你看到的另一个例子——Cosmos——则是用计算机图形去控制生成式AI。归根结底,一切都在于“控制”。

      我们希望AI是“有根基”的。我们提出“检索增强生成”(RAG,Retrieval Augmented Generation)的一个重要原因,就是要让生成建立在真实基础之上:你提供一些文本或数据,AI再基于这些真实信息去生成内容。

      昨天我也提到,在AI的世界里,我们是否需要记录系统?是否需要SQL?答案是:绝对需要。因为SQL所代表的,是记录系统,是我们业务中最真实、最可靠的数据基础。

      而这些真实基础,正是用来“约束”和“支撑”生成的。否则,生成出来的就只是幻觉。

      你刚才看到的那个虚拟驾驶体验之所以真实,是因为我们񉎓D条件对它进行了约束——用各种必要的条件去“锚定”它,从而实现高保真的体验。在这种框架下,你可以生成任何内容,而且可以用文本、图像、3D等多种方式去控制它,其余的部分则由AI生成。

      所以未来的发展方向,要么是完全结构化的生成,要么是由真实世界数据来控制的生成。这就是未来。

      你会不会在你的眼镜里体验到这样的东西?答案当然是会的。在眼镜已经能看到真实世界的存在。如果我再用生成式AI去增强这个基础,就可以创造出更丰富的体验。

      Q10:您展示了Vera独立机架的部署形态。随着AI需求的持续增长,这些CPU的适用场景越来越清晰。您是否认为它们最终将承担x86架构在数据中心中传统承担的角色?这是否是一个数十亿美元级别的市场机会?

      黄仁勋:这些CPU是为数据密集型工作负载而设计的。它们针对的是高单线程性能需求,同时也面向电力受限的数据中心环境。在这种场景下,它们的每瓦性能可以实񈓢倍提升。

      目前市场上没有其他CPU能做到这一点——除了Vera和Grace。在电力受限的数据中心中,实际上,所有采用英伟达产品的数据中心基本都是电力受限的,因为一旦你拥有兆瓦级的电力,你会希望尽可能把电力用在GPU上,而不是浪费在CPU上。

      原因很简单:GPU在生成token、创造价值,而CPU并不是主要的价值生产者。因此,如果可以,你会希望把绝大部分电力预算分配给GPU。

      当然,我们仍然需要CPU,但我们要让它们极其节能。这也是为什么我们使用LPDDR内存。同时,我们的CPU在单线程性能、带宽效率方面都处于全球领先水平,带宽甚至达其他方案的三倍。

      之所以把带宽做得这么高,是因为我们需要处理海量数据的移动。因此,我们设计了Vera、Grace等CPU,它们是专门为AI时代打造的。

      它们适用于所有场景吗?未必。比如“每美元性能”可能不是最优,但那并不是我们要解决的问题。

      举个例子,在过去十年的超大规模数据中心中,CPU设计的核心目标是最大化每颗芯片的核心数量。因为在云计算模式下,用户是按“核心数”租用资源的。所以,对于云厂商来说,“每美元核心数最多”的CPU就是赢家。

      但AI不一样。AI关注的是“完成多少工作”,而不是“有多少核心”。

      如果你有价�亿美元的GPU在那里运行,你绝不会让它们因为CPU处理不过来而闲置,这些CPU可能就价�亿美元。你需要的是让CPU尽快完成任务,�亿美元GPU持续高效运转。

      所以,我们的优化方向完全不同。我们打造出了一种截然不同的CPU架构。我们始终从“要完成什么工作”出发来设计系统。一旦这一判断最终变成显示,我们就构建出最合适的整体系统。

      无论是Vera、Rubin,还是存储、CPU、网络、甚至整个机架,都是围绕我昨天提到的那类工作负载来设计的,也就是智能体。

      事实上,OpenClaw就是一个很好的例子。在数据中心中运行OpenClaw,配合Vera Rubin整套系统,是非常理想的组合。

      所以,我想这应该回答了你的问题。

      Q11:看起来Feynman将采用某񌈅D堆叠工艺。请问您能否介绍一下主Die、IO Die)以及先进封装技术的规划方向?供应链稳健性是否也在你们的考量之内?

      黄仁勋:供应链的弹性、多样性总是影响我们的业务,因为我们规模很大。然而,如果我告诉你,那明年参加GTC还有什么意义?到时候就只剩你和我,两个人。

      Q12:你昨天介绍了LPU的集成,OpenClaw的出现似乎真的让您眼前一亮。OpenClaw如何改变了你的日常生活?如何改变了英伟达的战略?

      黄仁勋:当OpenClaw出现,我们意识到世界终于拥有了一个开源智能体——我们现在几乎可以将其当作一个行业标准。我们希望尽可能多地向这个开源项目贡献能力,避免世界因此分裂成太多互不兼容的分支项目。

      如果我们能将这个主项目打磨得足够优秀,全球每家公司都能以此为起点,构建自己的智能体战略。

      OpenClaw之所以意义重大,关键就在于它是开源的。它已经非常强大,工程质量相当成熟。我们将在未�年间持续为其注入能力,就像我们持续向Linux和Kubernetes贡献代码一样。

      试想一下,全世界都有了一个可以共同贡献的平台。想象OpenClaw未来将变得多么强大。OpenClaw只需一行命令就能安装。安装完成后,你告诉它你想让它成为什么。

      比如你说:我希望你学习这个新工具。它便去阅读使用手册,可能是Skill文档,然后上网搜索它需要学习的内容,自行摸索如何使用。

      你给它一个最终目标:我想设计一个厨房,我的厨房现在是这个样子,这是我希望它未来呈现的效果。去下载相关软件,去学习这些应用,找到使用它们的方式。

      如果需要订阅某个服务,只要不超过这个金额,你有我的授权去订阅。然后帮我设计厨房,找到合适的家具,给我几个家具示例和报价,帮我做平面布局,渲染给我看。

      我刚刚这通指令,就是给了它一个它能够完成的项目,然后它便独立出发,学习、调用工具,反复尝试。

      它生成第一版厨房设计,与你给它的参考图片进行比对,然后判断:“差得有点远,继续改。”于是一遍又一遍,直到完成后返回给你。

      第一次完成后,你给它一些额外指导,它再次回来。完成后,它便学会了这项技能——它学会了如何做室内设计。于是,它将自己的学习成果总结成一份技能文档,存入记忆。

      下次你说“帮我设计客厅”,它便回想起:“原来设计房间是这么回事。”它会表现得更好。你再次给它指导,它再次更新自己的技能文档。

      下一次你说我要设计卧室“,你能看到,它完全是在执行同样的过程:拆解任务,调用工具,运用记忆。这真的相当了不起。

      英伟达如今的运转速度比以往任何时候都快,但这是因为我们越来越多地使用AI,工作完成得更快了。所有项目的推进速度都在提升,这都是好事。

      说实话,我感觉自己越来越忙了。我今天与英伟达的工作体验是:它让我比以往任何时候都更忙——比六个月前更忙。原因就在于工作成果反馈得更快了,项目数量也增长得更快了。

      我认为这是所有人共同的体验。很多人说AI来了,我们会失去工作。恰恰相反。事实是:PC让我们更忙了,互联网让我们更忙了,移动设备让我们更忙了。

      AI将以超快的速度完成任务。你写一份规格说明、一份架构文档、一份产品定义,交给智能体,30分钟后,它又回到你的案头了。

      过去,你写完产品规格说明,团队拿去工作一个月。那个月里,你在做别的事情,生活节奏相当从容。如今,那一个月已经压缩成�分钟,你随时都在关键路径上。

      这位朋友的工作并没有消失,只是感觉更忙了。我的判断是:AI将使我们以如此之快的速度推进工作,以至于我们最终会承担更多的工作量。

      Q13:在AI算力市场中,Vera Rubin带来的需求有多少是新增量,又有多少是超大规模云服务商对Blackwell的升级替换?

      黄仁勋:这个问题的答案,最终取决于我们所处的产品设计周期与建设周期的哪个阶段。

      这就好比iPhone 3发布时,iPhone 3的销量中有多少蚕食了iPhone 1的市场,又有多少是新增销售?

      事实上,iPhone 3销量�.9%都是新增销售。iPhone 4发布时同样如此,99.9%是新增,而非替换。直到大约十年之后,这种格局才开始发生变化。

      一项技术扩散到全世界,大约需要十年左右。如今大约每四年就会迎来一轮新的资本支出周期。

      我的判断是:我们目前处于英伟达推理拐点的第一年,这是十年来推理领域真正意义上的第一个拐点年。十年之后,市场可能趋于饱和。而Vera Rubin是拐点的第二年,新增需求的比例同样会达�%。

      Q14:请问您能否更新一下英伟达在中国数据中心业务的信心水平,以及这些出色的产品未来能否在中国市场重新建立有实质意义的存在?

      黄仁勋:我能够回答的是:我们已经获得了向中国众多客户销售H200的许可证,也已经收到了来自众多客户的采购订单,目前正处于恢复生产的过程之中。

      这对大家来说是新消息,与两周前的情况已有所不同,这是我们当前的实际状态,供应链也正在重新启动。大家很快就会开始听到相关消息。

      其次,我认为特朗普总统的意图是:美国应当在获取英伟达最先进技术方面保持领导地位,但他同时也希望我们能够在全球范围内参与竞争,而不是不必要地拱手相让那些市场。

      综合我刚才说的三点——H200许可证、客户采购订单,以及他所表明的相当直接的意图,我有充分理由相信他的立场始终如一。

      Q15:我很想进一步了解您在开源模型方面的愿景。我个人认为开源AI是现有体系的重要补充。请问英伟达推进开源的驱动力,究竟更多来自生态系统扩张、客户基础延伸,还是战略层面的考量?Nemotron的路线图是否会长期坚持下去?

      黄仁勋:我们已经发布了GR00T 1、GR00T 2,Cosmos 1𴵺也已发布,Nemotron 1、2、3均已推出,Nemotron 4我们已启动联合开发。之所以要对模型进行编号,是因为你有持续推进的意图。

      就像CUDA,我们现在已经到了CUDA 13。这本身就回答了这个问题——我们绝对有意愿持续推进前沿附近的基础模型研发。

      我们未必要做到绝对前沿。那并非我们的使命。我们的使命有几个层面:我们希望为世界打造可信赖的开源模型,以英伟达的体量和能力,确保每年稳定迭代,让所有人都知道,你们可以信赖我们。说到做到。

      另一个原因是:我们自己在开发模型的过程中,可以针对新一代芯片和系统架构对模型架构进行深度优化。这是其他团队未必能做到的。

      举个例子,如果没有TensorRT-LLM,我们就无法探索NVLink 72的性能极限;如果没有Dynamo,我们就无法探索解耦推理的边界,也就不会有后来收购Groq团队的决策。拥有自己的软件团队,保持工业级、前沿水准的软件能力,使我们能够在整个系统层面持续创新,软件与硬件相互成就,形成正循环。

      我们对开源模型生态系统的投入是坚定的。

      Q16:英伟达自动驾驶业务目前约占公司总营收񊄩%。您认为,决定自动驾驶业务能否对英伟达财务业绩产生实质性影响,最关键的挑战是什么?

      黄仁勋:这个问题对我来说意义特别深刻。英伟达的CUDA业务曾经占总营收񊄨%,却占据了我�%的成本。任何理性的人都会放弃,但如果我们真的放弃了,在座各位今天就不会出现在这个房间里。

      25年前,我们首次推出可编程着色器时,没有人知道如何使用,没有人愿意为此付费,没有任何评测机构认为这是个好主意。如果我们当时放弃了,可编程着色就不会有今天。

      8年前,我宣布推出RTX光线追踪时,所有人都认为这是个笑话,说光线追踪一塌糊涂。如果我们没有RTX,今天的全场景路径追踪计算机图形学也不会有今天。

      事实证明,我们最初做的几乎每一件事,都耗费了大量资金,却毫无回报,甚至引来不少质疑。因此,你必须坚信自己所相信的,然后决定是否值得继续追求。

      10年前,我开始投入自动驾驶。最初的团队只有我和另外一个人。我们踏上了这段探索之旅,试图弄清楚自动驾驶的技术难题究竟是什么。如今,我们有数千人在从事自动驾驶相关工作。

      你说它只𴇁%,但请记住,英伟达的自动驾驶业务实际上涵盖三台计算机:训练系统、合成数据生成与仿真系统,以及自动驾驶车载系统本身。只有最后一部分被我们归类为自动驾驶业务,但因为我们深耕这个领域,整体业务规模远比大家认为的要大。

      特斯拉购买英伟达系统用于训练,Wayve以及全球每一家正在研发自动驾驶的公司,无论是卡车、面包车、乘用车还是无人出租车,都在向我们采购这三台计算机中的一台或全部。这个规模相当可观。

      但即便业务规模为零,我也会继续推进。为什么我如此确信自动驾驶一定会实现?因为我完全相信,自动驾驶在技术层面已经是一个被解决的问题。我们花�年才走到这一步,但它确实已经被解决了,剩下的只是工程层面的持续打磨。

      10年之后的某一天,全球每𷮛万亿英里的行驶里程将实�%或接�%的自动驾驶。今天,这一数字之所以有限,唯一的约束就是司机座位上的人,也就是驾驶仍需要人的参与。

      如果没有这个约束,全球每天的行驶里程一定会大幅增长。假设每天񀙜万亿英里,再乘以每英里若干美元,这将是一个数万亿美元量级的市场。

      大多数数万亿美元量级的市场,在某个时间点都是从零开始的。所以我完全接受它现在还在零附近,我的信念不会改变。

      Q17:在您看来,欧洲成为优质AI合作伙伴最有力的信号是什么?

      黄仁勋:欧洲许多国家,德国、瑞典以及英国的部分地区,曾是上一次工业革命的发源地。事实上,有三个国家引领了全球机电一体化的发展,这是技术与机械工艺、工业化的深度融合。机电一体化在德国、瑞典、日本都非常强大;美国曾经也很强,但我们将制造业外包得太多了。

      然后,下一场工业革命来了——IT和软件革命,这对制造业来说非常陌生。制造业的文化是严格的、一步一步的,每一件产品在发货之前必须完美,因为它可能伤害到人。而软件的运作方式是集群式的,你必须在它还没有完善之前就发布,因为如果你不发布,它永远不会被修复。

      这不只是技术上的差异,而是深层的文化差异。正是这种文化差异,导致美国在IT革命中全面主导,而德国却被落在了后面。

      但希望来了。OpenClaw不需要你去编程,它只需要你告诉它该做什么。

      你可以跨越IT革命,直接跳跃到AI革命。这正是我每天对德国、日本、韩国、瑞典所说的话:这是你们的机会,让过去成为过去。这已经不再重要了——因为正如大家所知,软件工程师已经不需要再写代码了。对德国来说,这应该是最令人振奋的消息;对日本来说,同样如此。

      直接拥抱AI,然后将AI技术与你们世界级的机电一体化工业能力深度融合。你们将一跃成为全球机器人产业的领导者。我是你们最坚定的拥趸。

      Q18:随着推理需求的兴起,大量初创公司和成熟企业涌现,试图解决速度、内存、功耗等各种瓶颈。其中有些公司公布的token效率数据,与英伟达产品的表现形成了直接竞争。这与GPU早期时代的竞争格局似乎大不相同,被认真对待的竞争者明显更多。我们如何确信英伟达的推理方案是最快、最优的?如果Groq加Vera Rubin成为主流推理解决方案,英伟达又将如何维持这种领先优势?

      黄仁勋:我建议大家参考两到三个基准测试,直接看客观事实。

      第一是MLPerf,这是行业内最严格的基准测试。大家去看看英伟达在其中的位置,我们在MLPerf推理和MLPerf训练两个榜单上全线第一,而且大多数参与者根本无法完成全部测试项目。

      第二是SemiAnalysis,这可能是目前覆盖最全面的推理分析,涵盖你能想到的每一个维度,结果同样是英伟达。如果允许我引用别人的话,“推理之王”,我就是喜欢这个称号的感觉。那条冠军腰带也很漂亮,通常你得到的是玻璃奖杯,不知道放哪里好,但一条冠军腰带,这种感觉蛮好的。这就能清楚地告诉你我们在推理领域的位置。

      第三是Artificial Analysis,涵盖了所有API推理服务公司,对每一家推理服务商进行全面评测。你会发现英伟达在整个榜单顶端,而且英伟达是该榜单覆盖的�项服务中唯一一个全系列上榜的解决方案。

      事实已经说明,我们在推理领域非常、非常强。我们理应获得这份认可。我们的推理之所以如此出色,不只是因为我们的浮点运算能力强,而是因为我们进行了极致的协同设计。

      推理是一个巨大的计算机科学问题,是一个巨大的计算机系统工程问题,涵盖CPU、GPU、纵向扩展交换机、横向扩展网络技术、内存技术、存储技术——所有这一切必须协同运作才能做好推理,而我们比任何人都做得更好。

      Q19:请问英伟达与台积电在共封装光学(CPO)方面的合作进展如何?另外,美国商务部长曾希望将台�%的芯片产能迁移至美国,这在现实中是否可行?

      黄仁勋:首先,我们与台积电共同发明了CoUP,这是一种将电子器件与硅光子引擎直接集成在同一块芯片上的技术。我们为整条供应链申请了�项专利,并将我们的全部技术开放授权给整个供应链,以便各方能够协同打造硅光子CPO(共封装光学)技术——让电子与光子在同一个封装中融合。

      目前,我们占据了台积电COUP工艺产能的绝大多数。Spectrum-X的量产爬坡已经启动,未来还将持续扩大规模。

      关�%这个目标——在当前及近期来看非常难以实现,因为需求仍在持续高速增长。台积电正在尽全力在美国亚利桑那州及周边建立新产能,整条供应链也在美国本土布局。然而,新晶圆厂和新工厂还在建设的同时,全球整体需求的增速之快,使得在近期内实�%这一目标将极具挑战。

      Q20:您向Nebius投资�亿美元,同时也投资了Lumentum和Coherent。请问您在做这些投资时的思路是什么?

      黄仁勋:我们始终在思考两个方向:上游供应链和下游合作伙伴。

      你必须想象英伟达的技术与全球解决方案的完整整合路径,一直延伸到最终用户侧——有人在消耗token,有人在使用OpenClaw,有人在使用ChatGPT、Anthropic,有人在使用Runway、Black Forest Labs……你必须把这条链路想通到底。

      向上看,未񀧴~5年,我的上游供应链需求是什么,我现在应该为此做哪些准备?向下看,我需要怎样的下游产能——土地、电力、厂房,或者开发者生态——未񀧳~5年我需要什么?

      当你向上看,你会发现我们正在随Spectrum-6大规模引入硅光子技术,并将在未来几年把硅光子加入到NVLink的纵向扩展技术中。

      这意味着我们所需的硅光子产能,将远超今天全球现有水平。因此我们与供应链合作,提前帮助他们建立产能。有时我们提前付款,有时只是给出预测,有时如果某项技术产能极度紧缺但需求巨大,我们可能会选择直接投资该公司,同时提供预付款、预测以及其他支持。

      Coherent和Lumentum就是这样的思路,这属于我们上游供应链的战略布局。

      而Nebius则是下游合作伙伴的投资。上游一个方向,下游另一个方向。我始终沿着整个技术与制造的生命周期进行全局扫描,持续为公司的增长做好准备。

      Q21:数据对于世界模型极为重要,游戏能产生大量数据。请问游戏玩家数据和云游戏数据,对于世界模型训练是否真正有价值,甚至能够超越游戏本身的应用范畴?

      黄仁勋:在一定程度上是的。但需要注意,大多数游戏并不严格遵守物理法则。比如在《堡垒之夜》中,角色的奔跑动作与其体型所能支撑的速度并不匹配,是一种半跑半飞的状态。因此,在训练希望基于物理规律的基础模型时,必须小心过滤掉这类不符合物理规律的观测数据。

      游戏中的角色可以从山顶跳下,游戏与现实中树木摇曳、海浪起伏的方式完全不同。如果条件允许,你应当回归真实基准数据。当然,你也可以使用遥操作数据,或者使用仿真数据——这正是Newton的用武之地。

      Newton和Isaac Lab运行𶞓D图形环境中,但其动画是完全基于物理仿真的,碰撞遵循物理原理,关节运动遵循逆运动学。因此,Newton和Isaac Lab中的所有属性都严格遵守物理规律,可以将其与真实世界的可观测数据结合起来,共同训练世界模型。

      一旦世界模型达到足够的能力水平,你甚至可以反过来。񉎓D图形控制世界模型来生成新的合成数据。这就形成了一个飞轮:最初我们使用真实视频数据,然后񉎓D仿真数据加以增强,帮助我们构建出世界基础模型,再用遥操作𽓟D仿真来控制它,进一步放大合成数据的生成规模。这个飞轮正在启动。

      这有点像:你必须先积累足够的知识,理解事物的运作规律,然后才能想象未来的各种可能场景。我们训练了自己的世界基础模型,现在能够生成各种未来的可能性。而这些对未来的合理推演,本身就成为了我们的学习素材——我们将它们转化为训练数据的真实基准。

      就我个人而言,在思考英伟达的战略和行业走势时,我其实生活在一个完全由脑中模拟构建的未来里。我会定期校验这个模拟是否与现实保持一致,持续重新评估。如果我的假设、我的模拟与现实始终保持连贯,说明我对未来的判断正在成真,我便坚守这个愿景,始终如一。

      Q22:英伟达在Spectrum X上采用了CPO。这项技术会扩展到整个网络产品组合中吗?大规模生产的关键挑战是什么?另外,这会加深与中国台湾CPO供应链的合作吗?

      黄仁勋:我从后往前回答。我们与台湾CPO供应链合作非常紧密。当然,这个供应链始于台积电的芯片制程工艺,每一个环节,包括组装和封装,都极其复杂。

      Spectrum 6取得了巨大成功。事实上,Spectrum 3也是巨大成功。Spectrum 4是我们的第一款以太网交换机。当时所有人都认为我们很难打入以太网领域,但我们完全专注于AI以太网,彻底重构了以太网技术,以支持AI特有的流量类型和计算模式。

      Spectrum 4、5、6都是巨大的成功。我们现在已经是全球最大的网络公司了。这实际上是NVLink和Spectrum的完美结合,都是本垒打级别的成功。

      Q23:去年底,Allen Institute的一位知名研究员曾警告,AI算力扩展的可用杠杆——包括数据、精度等——大约还有两年就会耗尽。您之前提到Blackwell引入了MX数据格式,Vera Rubin又有所推进,请问英伟达手中还有哪些扩展维度尚未动用?

      黄仁勋:NVFP4不只是改变了浮点数的精度,而是彻底重构了整个张量核心引擎(Tensor Core Engine)的结构。NVFP4本身就是一套张量核心引擎,而不仅仅是一个数值格式。

      它的处理结构是动态的——动态上采样、动态下采样,从而在尽可能节省能耗、提升计算量的同时,保留最终计算结果的精度。这套动态调整机制,正是张量核心引擎之美所在。

      整个行业在FP8上的普及才刚刚稳固,我们已经在推动向NVFP4的迁移了。再往后,FP1这类格式确实有些奇特,精度扩展的空间大概也快到头了。所以你最初的判断并非没有道理。

      但英伟达有一个重要优势:极致的协同设计。过去十年,我们的计算效率提升了�万倍,而摩尔定律在同期只贡献了�倍。摩尔定律鼎盛时期的预测是十�倍,而我们做到�万倍。我们不只是靠精度的提升。

      单靠精度,每年大约只񀙜倍的提升空间。我们的速度远超精度扩展所能解释的范围,未来也将如此。我们还有很多旋钮可以拨动。

      每一年,我都会向大家展示新的旋钮。去年,我们展示了NVLink 72,在功耗大致相当的前提下,性能提升�倍。这就是架构的力量,这正是极致协同设计如此重要的原因。

      也许可以给大家一个小提示:未来不只是关于大模型层面的优化,未来是关于智能体系统。智能体系统使整个问题空间再次大幅扩展。而当问题空间扩展,你就有更大的机会去寻找那个质的飞跃。

      Q24:随着智能体工作流的兴起,许多人认为新思科技、Cadence这类传统软件平台将被取代。请问您如何看待AI与这些软件公司之间的关系?

      黄仁勋:请转告散户投资者,他们的判断完全错了。这甚至不是我需要保护的业务,但是非对错还是要讲清楚。

      举个例子,新思科技、Cadence,以及所有设计工具,它们业务规模的上限,取决于有多少工程师坐在那里使用。工程师数量有多少,工具就能卖出多少许可证。就像管道工多了,管道工具就卖得多;木匠多了,木工工具就卖得多。

      但未来,我们将拥有大量AI智能体工程师。这些智能体工程师会做什么?凭空生成晶体管吗?不,它们会使用和人类工程师一样的工具,因为工作完成后,必须把结果放回人类可以理解的结构化数据中。

      如果我无法理解、无法控制输出结果,这就回到了我们反复提到的可控性问题。SQL会因为智能体的出现而消亡吗?不会,SQL恰恰是我们业务真实基准的存放地。当智能体完成工作,请把结果放回SQL,这样我随时都可以去查询。

      同理,当智能体完成芯片设计,它会使用新思科技和Cadence的工具,设计结果最终也会回归到这些工具的文件系统和数据结构中,这才是设计的真实基准。

      如果我需要精确复现设计,不是“大概能用”,而是“必须精确可用”,AI深度学习可以生成大致可行的设计,但我不能接受“大致可行”,我需要“完全精确”,而这正需要新思科技的工具来保证一致性。正因为有了智能体,我们需要授权的新思科技工具数量很可能会爆炸式增长,而不是减少。

      有些人有个奇怪的想法,认为AI可以从零开始凭空生成晶体管,他们以为英伟达工程师每天就像在用Nano Banana生图一样设计芯片。这里没有贬低Nano Banana的意思,但芯片设计必须一层一层地精确构建,因为它必须是可验证的、可理解的、可重复的、可控的——不能依赖概率。

      Q25:请问你去年最大的挑战是什么,今年最大的风险又是什么?

      黄仁勋:我的工作可太难了。就一条吗?我的人生哲学非常简单:别被开除,别无聊,别死。在这三者之间,尽量保持平衡。

      这对英伟达同样适用:不要被客户开除,不要无聊到公司停止创造价值,不要倒闭,然后待在这三者的中间地带。

      这就是人生秘诀,去年如此,今年亦然——你可以说是黄仁勋的“人生三诀”。这三条听起来简单,但每一条都是极高风险的。

      Q26:在中东战争和全球地缘政治动荡的背景下,英伟达如何看待在中国台湾方面的风险?

      黄仁勋:首先,我们在以色列�个家庭,我非常担心他们。我知道他们自己也很担忧,但我们公司仍在非常努力地运营,员工们依然在非常努力地工作。尽管如此,这丝毫不减轻我们对他们的牵挂。我对以色列的承诺是百分之百的——我们会长期在那里,员工得到我们百分之百的支持。

      对中国台湾同样如此。我们在那里有数千名员工,他们深耕于此已经很长时间。我们整条供应链都在那里,与我们合作的数百家公司中,不乏全球最重要的企业。

      我唯一的希望,是大家都能携手合作,保持和平,着眼大局,保持冷静,不断提升自身韧性。我百分之百相信,我们将继续依靠和倚重以色列的出色产业;我同样百分之百确信,整个世界将在很长很长一段时间内继续依赖中国台湾。

      Q27:如果您的愿景得以实现,十年后英伟达会是什么面貌?

      黄仁勋:我们会非常忙碌。希望届时英伟达拥有�名员工,规模尽可能精简,同时足以支撑使命。

      �名员工将�万个AI智能体协同工作,智能体全天候不间断运转。希望我们的员工不需要跟上智能体的节奏,我很确定他们也跟不上。

      这就是未来。我们将解决一些真正了不起的问题。

      我们今天正在努力解决的那些事情,十年前没有人会想象这是可解的。机器人基本上已经是一个被解决的问题;自动驾驶汽车基本上也是一个被解决的问题;药物研发,我们正在像对待工程问题一样对待它。延长人类寿命——这一切现在都完全处于可能性的范围之内。

      十年前,没有人会想象这些是可实现的。而十年后,最好的思维工具之一,就是认识到不可能其实相当实际可行——任何看似需要数百万倍能量、成本或时间的事,都可以被压缩数十亿倍。距离会缩短,一切将因机器人变得更轻盈,事情会完成得更快,能源消耗也将大幅降低。

      在我刚毕业的那个年代,我们今天谈论的一切,连科幻小说里都没有出现过。我们现在谈论的这些事情,本身就已是非凡壮举。

      关于人类,我唯一可以确定的是:我们如今允许自己打开想象力去解决的问题,比四年前多出了百万倍。那么再过十年,当我们意识到还能解决哪些问题时,会是什么景象?

      那些问题我们甚至还没开始想象。因此,我非常确信,未来还有无数等待我们去解决的伟大问题。我甚至嫉妒那些四十年后还在世的人。

      Q28:Vera Rubin整体系统,主要是为了解决当前的技术瓶颈,还是在重塑AI的商业模式?

      黄仁勋:我们构建的每一套系统,都能让当前的问题和工作负载得到数倍的提升,同时也总会开辟出一片新的问题空间——那些我们今天还无法解决的问题的新视野。

      昨天我展示图表时,有一个规律我每次都会呈现:我们既向上推——对于任何给定的工作负载,我们持续提升吞吐量和性能;也向右推,AI变得更聪明,能力边界不断扩展,出现新的可能性。

      举个例子:今天使用ChatGPT或任何AI,你大约能获得每�个token的生成速度。而我展示的图表是每�个、乃�个token。想象一下——你按下回车,答案以�倍的速度返回。

      未来,当你还在输入的时候,AI已经在思考了;等你按下回车,它已经完成了。不论是帮我写一个网站程序,还是帮我设计一个厨房——按下回车,完成。

      这就是未来。每一年,我们提升吞吐量,我们扩展可能性的边界。

      Q29:您说AI让我们所有人都更忙了,但同时您又预测物理AI和机器人将承担今天工人从事的体力劳动。这两件事如何能同时成立?未来会不会出现大规模失业?

      黄仁勋:首先,全球目前有数千万制造业岗位的缺口。大家知道吗?我们的卡车司机短缺数百万。制造业工人短缺数千万。就业率很高,但很多公司仍然招不到足够的劳动力,大多数公司都面临劳动力短缺的问题。机器人将填补这个缺口。这是第一层。

      填补缺口的结果,是所有国家的经济都将增长。而经济增长时,大多数公司往往会雇用更多人,用来管理更多机器人,管理更多智能体,推动业务增长,发现新问题、解决新问题,嵌入新技术,发明新产品、新服务。这很可能就是未来的轨迹。

      我之所以这样判断,是因为:如果我取今天这个点,再�年前那个点,连成一条直线——就业岗位数量一直在增长,各国经济一直在增长,我们所有人都比以往任何时候都更忙。

      你上一次坐在门廊的摇椅上,喝着一杯柠檬水,看夕阳西下,是什么时候?那个画面�年前的事了,不是吗?我们比以往任何时候都更忙。这条趋势线大概率还会延续。

      我们都将有稳定的工作。当然,每一种职业都会发生变化,有些工作会消失,有些工作是全新的。就像过去人们用马来耕地、代步,而现在一匹良马价�万美元。世界在变,AI会改变这一切,但我相当确信,这将是一个更美好的世界。

      Q30:昨天的公告中提到了现代、日产、比亚迪、吉利与英伟达的合作。对于比亚迪和吉利而言,L4级别的自动驾驶功能落地,在中国的监管环境下究竟如何运作?

      黄仁勋:这是这样运作的:在中国,比亚迪、吉利、小鹏、理想都是我们的合作伙伴和客户,它们发展得很好,也将继续发展得很好。我们与它们共同基于DRIVE Hyperion实现了传感器和计算架构的标准化。

      当它们的汽车进入欧洲市场,某些国家可能无法接受它们的软件栈。这时,英伟达的软件栈就可以直接启用。而在中国,它们使用自己的软件栈完全没有问题。在欧洲或亚洲的某些地区,如果当地软件栈不适用或不被接受,我们的软件栈就可以替代上去。

      中国政府的规定适用于中国,但并不适用于德国。比如,如果比亚迪想在德国以自动驾驶模式运营、接入Uber,它完全可以使用DRIVE OS来实现。

      这就是双赢的方案。我们只是想让所有人都满意。

      (现场,全球规模最大的汽车媒体Motor Trend宣布授予黄仁勋“年度人物”)

      黄仁勋:真的吗?太棒了,谢谢。我要站在这里,直到再多拿几个奖。不过我需要忏悔一下,我已经两年没有自己开车了,我现在是被自动驾驶接送的。我得了“推理之王金腰带”、“Motor Trend年度人物奖”,太棒了。

      Q31:CUDA�年发布,市场过了很多年才真正理解它的价值;NVLink 2014年推出,NVLink 72 去年才被广泛认可。请问您认为英伟达现有产品中,哪一个是市场目前尚未充分理解、但五到十年后将被证明极为重要的?

      黄仁勋:我会说Alpamayo是其中之一,Cosmos是其中之一,Omniverse绝对是其中之一,Dynamo已经被人们理解但尚未被充分重视,它对AI工厂整个生态的深远影响,毋庸置疑。

      还有一个概念:如何在AI工厂的语境下思考性能这个问题?这是一个非常新的概念,我还需要多次反复讲解。

      但终有一天,全球每一位CEO都会懂它,每一个董事会都会理解它,每一家公司都会用它来估算自己未来的营收,它将成为工厂运营流程和企业战略规划的核心组成部分。

      这个概念对未来的产业极为关键,但目前理解还不够深,我需要再讲�遍,没关系,已经有足够多的人理解了,但还有很多工作要做。

      Q32:你曾说过,希望大家经历大量的痛苦和磨难。请问在一个相对完美的世界里,您会推荐人们去经历什么样的苦难,才能走到您今天的位置?

      黄仁勋:首先,那番话是对一群大学生说的。在座各位已经是研究生以上了,应该好好享受生活了。

      苦难嘛……你看,每当你学习一件新事物,都伴随着相当程度的痛苦;每当你做超出舒适区的事情,都会如此;每当你站在台上做主题演讲,知道所有人都在评判你,而你也知道自己可能不会像自己期望的那样完美——这其中始终有一份焦虑与痛苦。

      备战任何事情都需要大量的投入,苦难无处不在,这毋庸置疑。这正是追求卓越不可或缺的一部分,是追求成为最好的自己不可或缺的一部分。只要你感到自己在全力追求成为最好的自己,竭尽所能,把一切都留在场上,那么苦难一定已经发生了。

      谢谢大家。

      • 上一篇:{loop type="arclist" row=1 }{$vo.title}