菜单
首页财产ai正文 黄仁勋最先焦急甚么? 当所有人都于算token成本时,英伟达更于意的是——谁来界说这些token从哪里孕育发生,谁又于指导token的消费。而真实的领先者,往往最清晰本身可能掉去甚么。 2026-03-20 13:12 ·微信公家号:甲子光年苏霍伊 AI投资人解读· 英伟达于AI推理竞争中转向体系级工程能力竞争,收购Groq构建AI工场;黄仁勋从头订价token,结构算力调理系统;OpenClaw受高度器重,有潜力成行业尺度;英伟达介入算力资产设置装备摆设,把握两重信息上风。 · 行业竞争激烈,推理架构不停演进,竞品芯片频仍呈现;安全、管理、隐私等是OpenClaw面对的要害议题;算力本钱开支周期影响企业谋划。 总结:英伟达于AI范畴上风显著,经由过程多种方式强化自身职位地方,但面对竞争与新挑战,需连续立异并应答危害,以巩固行业领先职位地方。内容由AI天生,仅供参考
美国本地时间3月18日,「甲子光年」受邀到场了英伟达开创人兼CEO黄仁勋于GTC 2026进行的媒领会。
黄仁勋年夜概是整个硅谷里最不怕记者发问的CEO,他不仅与全世界记者妙语横生,还有试图象治理英伟达员工同样看待记者。
现场一名记者的手机铃声响起,黄仁勋马上住手回覆,半恶作剧半严厉地说:“谁的手机,举手。”他还有进一步夸大,本身没甚么尤其不克不及容忍的工作,除了了“开会时手机必需静音,每一一名英伟达员工都知道。”而于面临末了一个发问的记者时,他重复夸大:“末了一个发问很主要,你要想清晰再问。”
近两个小时、三十多个问题,险些笼罩AI财产的每个要害环节,可以说是一次“信息过载”的问答。
但若把所有回覆压缩,会浮现出一条清楚的主线:AI正于重修计较基础举措措施,而英伟达试图成为这套新秩序的界说者。
从推理架构的分层,到AI工场的体系整合;从开源智能体的尺度争取,到全世界供给链的再结构,黄仁勋给出的是一套逐渐闭环的计较邦畿。
而OpenClaw(俗称:龙虾)为黄仁勋带来了新的高兴点,他于媒领会上重复说起OpenClaw并一遍遍夸大其主要性,假如说主题演讲上CUDA 20周年是英伟达对于已往的回首,OpenClaw就是黄仁勋对于将来的押注。他认为,ChatGPT是AI的拐点,由于它让所有人都能用上通用AI;但Agent体系一直只逗留于技能行业内部,年夜概只有25%的软件开发者于真正利用。然后OpenClaw呈现了,几周以内就成为了汗青上增加最快的开源项目。
看看各类龙虾的token耗损量,各人城市大白黄仁勋尽力保举OpenClaw的目的。
当所有人都于算token成本时,英伟达更于意的是——谁来界说这些token从哪里孕育发生,谁又于指导token的消费。而真实的*者,往往最清晰本身可能掉去甚么。
「甲子光年」从此次媒领会上黄仁勋的回覆中精选了五句话,别离是:
“英伟达不只造GPU,现实上于构建更弘远的工具。”
“每一个token都不是等价的。”
“OpenClaw是一件很是主要的事。”
“从许多层面来讲,咱们把握着先手信息。”
“别被解雇,别变患上无聊,别死。(Don't get fired, don't get bored and don't die.)”
1.AI推理厘革
媒领会上*个问题就直指AI推理及新发布的NVIDIA Groq 3 LPU。
黄仁勋笑着对于记者说:“你正看着推理*(Inference King)。”
随后他把时间线往回拉了两年,暗示英伟达从芯片精度、架构到体系互联,已经经缭绕推理做了好几代产物的预备。他重复夸大“推理是一个巨年夜的计较机体系问题”,要害于在谁可以或许买通从芯片、互联到数据中央的整套系统。
这暗地里是一个更要害的判定:推理竞争,已经经从单点机能竞争,转向体系级工程能力的竞争。
这也注释了英伟达为何要经由过程“技能授权+人材吸纳+资产收购”的组合方式,把LPU芯片厂商Groq的焦点能力“纳入系统”。
黄仁勋认可Groq于推理速率上“能打”,但实际世界的推理需求,从来不是单一维度:既要低延迟,也要撑持年夜模子,还有要承载长上下文。
单一架构没法同时满意这些需求,以是有了Groq与Vera Rubin的组合。
GTC上新发布的NVIDIA Groq 3 LPU,采用约500MB片上SRAM,并提供高达150TB/s的片上带宽,远高在传统依靠外部HBM内存的GPU架构,从而显著降低数据拜候延迟。同时,其FP8算力到达约1.2 PFLOPs,晶体管范围达980亿,表现出较强的计较能力与集成度。
比拟纯真寻求算力范围,Groq 3 LPU更夸大经由过程年夜容量片上存储与超高带宽的数据流架构,将数据“留于芯片内”高速流动,从底子上优化年夜模子推理历程中最要害的延迟瓶颈。
“我但愿Groq的插手能让各人留意到,英伟达不只造GPU,现实上于构建更弘远的工具。”黄仁勋说。
Groq插手英伟达系统后,外界也很体贴黄仁勋对于其的定位。
于他的计划中,一座算力工场75%仍将是纯Vera Rubin部署,Groq与Vera Rubin的组合只占25%。Vera Rubin才是焦点,Groq是侧翼。
他对于自家产物很自傲:“它其实太强了,咱们本身都不知道怎样逾越Vera Rubin,不然咱们早就造出能赛过它的产物了。”
于黄仁勋看来,就今朝token的主流耗损场景而言,Grace Blackwell及行将到来的Vera Rubin已经经无可对抗,Groq的插手转变的是邦畿的界限,而不是邦畿的中央。
黄仁勋吐露:“假如没有Dynamo,咱们就没法摸索解耦推理的界限,也就不会有厥后收购Groq团队的决议计划。”引入Groq是英伟达于推理深水区连续摸索的一定成果,是Dynamo让团队涉及相识耦推理的技能界限,由此看清了Groq的LPU于特定维度上的价值。
Dynamo是英伟达面向年夜范围AI推理而打造的软件平台,素质上是一个推理基础举措措施编排体系(Inference Orchestration Layer)。它解决的是一个焦点问题:怎样把算力使用率拉到最高。
“我但愿Groq之在英伟达,就犹如Mellanox之在英伟达同样,是一次架构层面的主要增补。咱们构建的不是一块GPU,而是一座AI工场。”黄仁勋说。
2019年英伟达收购Mellanox时许多人一样感应费解,而黄仁勋如今将那次收购视为架构补完的乐成先例,用一样的框架定位Groq,信息很清楚:他买的是AI工场系统中一块要害的架构拼图。
2.Token界说权
假如说推理是进口,那末AI工场才是英伟达的*形态,而AI工场出产的就是token。
于这场记者会上,黄仁勋屡次将竞争单元从“芯片”上移到“数据中央”,可以说是“三句话离不开token”。
“咱们今朝是成本*的token出产商,也是AI工场中吞吐量最高的token出产商。”他枚举了MLPerf、SemiAnalysis及Artificial Analysis三项基准测试,称英伟达于每个可量化的维度上都*。
值患上留意的是,黄仁勋给出了一个判定:“每一个token都不是等价的。”
黄仁勋进一步注释:“token可能由小型模子、较年夜模子或者超年夜型模子天生,对于应的输入上下文长度也从极短到极长不等。”
于初期的年夜模子语境中,token险些被默许视为“尺度化单元”——不管是API计费、推理成本,还有是机能对于比,各人都于用“每一百万token几多钱”来权衡。
黄仁勋试图对于token举行从头订价:token看起来同样,但出产它们的成本布局彻底差别。
为何差别?由于一个token暗地里是三组变量的组合:
模子参数范围
上下文长度
推理路径
这些变量叠加后,token的计较开消会呈指数级分解。好比,一个简朴问答天生的token,可能只耗损少少的算力;但一个“长上下文+繁杂推理链条”天生的token,其暗地里可能挪用了多层模子、跨多轮推理,甚至触发外部东西。这两类token于“数目上不异”,但于“成本及价值上彻底不等价”。
从市场角度来看,推理市场不会再是一个“同一价格曲线”,而会分成多个子市场。
一端是*低成本、极高吞吐的“基础token出产”(近似搜刮、简朴问答);另外一端是高价值、高繁杂度的“智能token”(如Agent决议计划、多步推理)。中间还有会形成年夜量分层场景。也正因云云,黄仁勋夸大“市场不会只有一种解法”。
「甲子光年」认为,当token再也不等价,竞争就再也不只是“谁的计较的成本更低”,而是“谁能于差别类型token之间做*分配”。这恰是体系级能力的表现,由于其需要同时调理差别架构(GPU、LPU、DPU等)、差别精度、差别互联方式。
以往英伟达和其竞争敌手都于寻求更强的芯片机能,虽然这一寻求还有于,可是英伟达已经经最先针对于差别token类型举行*出产的算力调理系统的结构。
从财产角度看,这句话也于开释一个旌旗灯号:将来的AI竞争,不会简朴收敛为“token价格战”,而更像是一场“算力分层与调理效率”的竞争。
谁能理解token的差异,谁才能真正介入下一阶段的游戏。
作为“Token King”,英伟达天然想把握token界说权,而OpenClaw的横空出生避世,给了黄仁勋讲新故事的时机。
“如今,推理的拐点已经经到来,OpenClaw呈现,Agent体系正于遍地广泛运用。用在推理的token出产范围才方才起步。”黄仁勋说。
3.重复被夸大的OpenClaw
于GTC时期,黄仁勋险些于每个场所城市提到OpenClaw。
于主题演讲中,黄仁勋花了很永劫间分享OpenClaw的作用和价值,他对于OpenClaw评价极高:“OpenClaw是人类汗青上*,也是*的开源项目。”他认为,OpenClaw的意义“就像昔时的Linux、HTML及Kubernetes”,甚至称它于短短几周内做到的事,“跨越了Linux 30年做到的事”。
而于媒领会上,黄仁勋依然于夸大“OpenClaw是一件很是主要的事”。
关在Agent体验,他提到:“这类体验仅限在企业内部,局限在科技行业,还没有向公共开放。” 但忽然之间,OpenClaw横空出生避世。咱们终究拥有了一个真正架构精巧的开源智能系统统。”黄仁勋于媒领会上提到,Claude Code持久以来重要面向企业级运用,是以年夜大都人还没有真正体验过智能系统统,“除了了咱们这些身处软件开刊行业的人。”
可以说,OpenClaw的呈现某种水平上转变了英伟达自身的战略姿态。
黄仁勋暗示:“当OpenClaw呈现,咱们意想到世界终究拥有了一个开源智能体——咱们此刻险些可以将其看成一个行业尺度。”
英伟达但愿尽可能多地向这个开源项目孝敬能力,防止世界是以破裂成太多互不兼容的分支项目,“假如咱们能将这个主项目打磨患上充足优异,全世界每一家公司都能以此为出发点,构建本身的智能体战略。”
他也明确暗示,英伟达将于将来30年间连续为OpenClaw注入能力,“就像咱们连续向Linux及Kubernetes孝敬代码同样”。
与此同时,英伟达推出了NemoClaw,这其实不是英伟达版的OpenClaw,而是英伟达为OpenClaw提供的企业级运行与治理软件栈。
经由过程NemoClaw,开发者可以安装NVIDIA Nemotron开源模子及OpenShell运行情况,为AI Agent提供安全断绝的履行情况,并插手数据隐私、收集拜候及计谋节制等安全机制,使持久运行的AI Agent越发靠得住及可扩大。
“基本上是一份颠末英伟达优化、专为企业级场景打磨的OpenClaw蓝图。如今只需一行代码、一键安装,每一个人都能得到一个强盛的智能引擎。”黄仁勋于记者会上依然于保举NemoClaw。
这个能力延长到物理世界一样建立。黄仁勋提到,因为已经同步霸占了认知AI,也就是AI认知范畴的OpenClaw,OpenClaw于呆板人内部运行已经经是“相称显而易见”的假想。采用统一推理技能的智能汽车,将动员呆板人技能于将来几年内实现超高速演进。于数据中央层面,运行OpenClaw共同Vera Rubin整套体系,是“很是抱负的组合”。
OpenClaw的影响远不止在科技行业内部。
一名来自欧洲的记者问到了欧洲相干财产的时机,黄仁勋暗示,上一次IT及软件革命对于制造业来讲很是生疏。制造业的文化是严酷的、一步一步的,每一一件产物于发货以前必需*,由于它可能危险到人。而软件的运作方式是集群式的,你必需于它还有没有完美以前就发布,由于假如你不发布,它永远不会被修复。恰是这类文化差异致使美国于IT革掷中周全主导,而德国却被落于了后面。
但OpenClaw转变了这个场合排场。“OpenClaw不需要你去编程,它只需要你告诉它该做甚么。”他想对于德国、日本、瑞典等国说的话是,“你们可以超过IT革命,直接跳跃到AI革命。将AI技能与你们世界级的电机一体化工业能力深度交融,你们将一跃成为全世界呆板人财产的*。”
还有有记者问到,跟着Agent事情流的鼓起,新思科技、Cadence这种传统软件平台将被代替?
黄仁勋回应:“请转告散户投资者,他们的判定彻底错了。”
他指出这些设计东西的营业范围上限取决在有几多工程师于利用。将来会有年夜量AI智能体工程师,“这些智能体工程师会做甚么?平空天生晶体管吗?不,它们会利用及人类工程师同样的东西”,由于事情完成后,必需把成果放回人类可以理解的布局化数据中。“正由于有了智能体,咱们需要授权的新思科技东西数目极可能会爆炸式增加,而不是削减。”
不外,OpenClaw面对的挑战一样真实。
黄仁勋坦言:“安全并不是*的难题,但确凿是一个极为严重的问题。安全、管理、隐私,以和所有与规范化智能系统统相干的特征,都是亟待解决的要害议题。”
「甲子光年」这几天于GTC现场感触感染到,虽然OpenClaw很火,但黄仁勋的举动已经经跨越了对于一个开源项目的通例违书,他更像是于重复确立一个新的行业共鸣。
于他的表述中,OpenClaw的主要性至少表现于三个层面:它让原本只属在少数开发者的Agent能力,最先走向更广泛人群;它具有成为“近似Linux、Kubernetes”的行业尺度的潜力;更主要的是,它正于从软件体系延长到呆板人、主动驾驶及制造业,成为一种新的交互范式。
但若把这些表述拼于一路看,会发明一个更深层的用意。
于推理及“AI工场”的叙事以外,OpenClaw现实上补上了英伟达于上层生态中的要害一环——不仅体贴token怎样被出产,也最先参与token怎样被消费。
某种水平上,这是一场关在“进口”的争取。
谁界说了Agent体系,谁就界说了将来计较的挪用方式;而谁界说了挪用方式,谁就把握了算力需求的流向。
也正是以,黄仁勋才会于差别场所重复夸大OpenClaw。
4.站于财产链更上游
当算力酿成资产,英伟达就再也不只是卖铲子的人,而最先介入矿的制作。
黄仁勋于媒领会上提到,英伟达愈来愈多地被要求为客户的数据中央设置装备摆设提供融资撑持。他的回应很直接:“咱们会向那些咱们确信会乐成的公司提供资助。”
这一变化,外貌上是发卖模式的延长,素质上倒是AI算力正于走向基础举措措施资产化的表现。
于传统IT时代,办事器是成本;而于AI时代,算力正于成为一种可以连续产呈现金流的“产能”。一个1GW级另外数据中央,其投资范围、收受接管周期与运营方式,已经经更靠近发电厂而非互联网机房。
于这类配景下,英伟达的脚色也于发生变化。它不仅提供GPU及体系,还有经由过程股权投资、供给链融资以和项目级撑持,直接介入到算力资产的设置装备摆设历程中。
他提到英伟达投资了CoreWeave、Nscale及Nebius,认为这些都是“全垒打”级另外投资。黄仁勋注释了英伟达为何有掌握认定这些是必胜之局:“由于咱们已经经看到了流向它们的营业。从许多层面来讲,咱们把握着先手信息。此中一些客户就是Meta、Azure、Anthropic等巨头。”
“以是英伟投资这些公司帮忙这些'新星'做年夜的危害很低。”黄仁勋将英伟达定位为‘超等助推器’,对于在流向它们的算力需求来讲,也是一种正反馈的“办事价值”,“没有英伟达这些公司也能完成融资,但这是咱们能融入整个生态体系的方式。”
谈和暗地里的投资逻辑,黄仁勋暗示,英伟达的眼光始终锁定于两个标的目的:上游供给链与下流互助伙伴。
向上游看,英伟达会推演将来2到5年的供给链需求,并提早布下先手;向下流看,则会评估将来1到5年需要如何的落地产能(包括地盘、电力、厂房举措措施)以和开发者生态。
他以投资Coherent及Lumentum为例,指出这是典型的上游战略结构。因为英伟达正跟着Spectrum-6年夜范围引入硅光子技能,将来几年还有会将其整合进NVLink扩大架构中,这使患上将来的硅光子产能需求将远超全世界现有程度。为了确保供给链不失链子,英伟达的手腕很是矫捷:“有时咱们付出预支款,有时提供明确的需求猜测;但若某项要害技能的产能极端紧缺且将来需求巨年夜,咱们就会选择直接投资这家公司。”
比拟之下,对于Nebius的投资则属在下流生态的押注。黄仁勋用一句话总结了他的年夜局不雅:“我始终沿着整个技能与制造的生命周期举行全局扫描,以此为公司的连续增加做好万全预备。”
「甲子光年」认为,英伟达把握着定单流与技能线路的两重信息上风,使其可以或许于必然水平上预判算力资产的将来现金流,这恰是基础举措措施融资可以或许建立的条件。
某种意义上,AI财产正于复制能源行业的路径——从装备发卖,走向产能设置装备摆设,再走向资产运营。而英伟达,正于测验考试站于这条链条的更上游。
5.人生哲学暗地里的焦急
黄仁勋坦言,本身比之前越发繁忙。
他暗示,英伟达如今的运转及项目推进速率已经经创下汗青新高,“说真话,我觉得本身愈来愈忙了,甚至比六个月前还有要忙。缘故原由就于在,事情结果的反馈更快了,项目数目的增加也更快了。”
他以一样平常事情为例申明了这类变化。此刻员工写好产物界说或者架构文档交给AI智能体,仅仅30分钟后就能拿到结果;而于已往,团队拿去开发凡是需要一个月,员工于那时期可以自在地处置惩罚其他事件。“如今,那一个月已经经压缩成为了30分钟,你随时都于要害路径上。”
针对于外界对于AI抢走饭碗的担心,黄仁勋给出了截然相反的结论:“许多人说AI来了咱们会掉去事情。偏偏相反,事实是:PC让咱们更忙了,互联网让咱们更忙了,挪动装备也让咱们更忙了。”据此他判定,AI将极年夜晋升人类推进事情的速率,人们终极会负担更多的事情量。
瞻望十年后的英伟达,他描绘了一幅人机协同的图景:届时公司将连结约7.5万名人类员工的精简范围,但会与750万个全天候运转的AI智能体并肩作战。他提到,但愿人类员工没必要去硬跟智能体的事情节拍,并调侃道:“我很确定他们也跟不上。”
“每一一种职业城市发生变化,有些事情会消散,有些事情则是全新的。”黄仁勋笃定地说,“世界于变,AI会转变这一切,但我相称确信,那将是一个更夸姣的世界。”
于媒领会的末了,黄仁勋用一种打趣的方式,总结了他的人生哲学:“别被解雇,别变患上无聊,别死。”
他增补说,这三条组成一个三角,“只管即便于这个三角中连结”。对于应到公司层面,则是:“不要被你的客户丢弃,不要让公司变患上无聊,不要倒闭。”黄仁勋说,“我已经经把我人生的奥秘都告诉你们了。”
假如把这段话放回此次GTC的语境中,它更像是一种被高度压缩的谋划逻辑。
“不要被客户丢弃”,对于应的是技能路径的不确定性。于推理架构不停演进、竞品芯片频仍呈现的配景下,英伟达必需连续证实本身于体系层面的不成替换性,这也是它从GPU走向“AI工场”的底子缘故原由。
“不要变患上无聊”,则指向生态与立异能力。当Agent成为新的计较接口,假如英伟达缺席这一层,它就有可能退回到“被挪用的算力供给商”,这也注释了他为什么于差别场所重复夸大OpenClaw。
而“不要倒闭”,则是对于当下算力本钱开支周期的实际回应。当数据中央投资范围迫近能源基础举措措施级别,企业不仅要算机能,更要算周期、现金流与危害。
这三条是乐成法门,也是黄仁勋的焦急地点。
于一个仍于快速重构的计较系统中,没有任何位置是安定的。芯片可能被替换,架构可能被重写,进口也可能被从头界说。
英伟达正于做的,是尽可能同时盘踞多个要害位置:于底层,它试图界说token怎样被出产;于中层,它试图重构数据中央,打造AI工场;于上层,它又试图经由过程OpenClaw影响token怎样被消费。
但正因云云,黄仁勋也比任何人都更清晰,一旦掉去此中任何一环,整个别系城市掉去支点。
虽然英伟达今朝依然是“Token King”,但“安不忘危”对于任何一家行业头部企业都十分须要。
【本文由投资界互助伙伴微信公家号:甲子光年授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。
-今年会jinnianhui官网