英伟达CEO黄仁勋最近越来越多提到AI工厂的概念。
5月,黄仁勋宣布英伟达与富士康合作,在中国台湾打造一台配备1万颗英伟达Blackwell GPU的AI工厂超级计算机。上周,黄仁勋又宣布,英伟达将在德国建设全球首个工业AI云,配备1万颗Blackwell GPU。英伟达还将在欧洲建20余个AI工厂。
在英伟达展示的图景里,汽车可以在虚拟环境中设计,机器可以在虚拟环境中训练,工厂产线可以在虚拟环境中优化后再到现实工厂运行。这些计算用到了AI。黄仁勋称,每个制造商都会有两个工厂,一个制造产品,另一个创造驱动这些产品的智能。
产生这些“智能”的算力来自实体AI工厂,也就是部署了大量GPU的算力中心。如果说英伟达指明了工业AI转型的主要方向,那么,随着各万卡算力中心落地,工业应用AI的转折点可以说在加速到来。
不过,还有一些问题需要厘清:英伟达在工业AI转型中扮演的角色是什么?这是工业AI转型的主要路径吗?这些大GPU集群是否将是未来的主要算力形式?
记者了解到,英伟达的路线更多是基于仿真平台Omniverse,将其搭配自家硬件做AI相关的仿真和数字孪生。这是一种比较新的路径,但不是工业企业做AI转型的唯一路径。目前,小模型和基于大模型的智能体也在改变工业的业态。
AI工厂是否唯一解
在英伟达具体的描述里,AI工厂被拿来与传统数据中心对比。区别在于,传统数据中心是为了通用计算而建,AI工厂是为了用AI创造价值,英伟达的GPU被部署在这些工厂中。
在AI工厂概念里,英伟达还“搭售”了自家的Omniverse平台。Omniverse是一个虚拟现实和仿真平台。如果看英伟达对工业AI云运行方式的描述,就不难看出Omniverse的重要性。
各制造厂商通过西门子、Ansys、Cadence这些软件厂商的产品,来使用英伟达的AI物理技术、Omniverse平台。其中,Ansys将Omniverse集成到高保真流体仿真软件中,以改进自动驾驶汽车的仿真场景构建。制造商中,舍弗勒用英伟达的技术进行数字工厂规划;宝马为工厂构建数字孪生,以助力生产规划团队实时协作并优化制造系统设计;梅赛德斯-奔驰用Omniverse以虚拟的方式设计和优化工厂装配线,以减少工厂停机时间。
仿真和数字孪生正是英伟达布局工业AI的切入口。黄仁勋描绘称,这个AI工业云可以用于设计和模拟,人能在虚拟风洞中完成模拟设计,可以实时打开车门、打开车窗、改变设计。舍弗勒近日已表态,将在2030年把一半以上的工厂接入Omniverse。
在一些工业AI领域的从业者看来,英伟达布局工业AI的路数便是建立算力中心,让Omniverse发挥平台效应吸引软件厂商和制造厂商,最终来消耗算力中心的算力。
“英伟达在树立标杆效应,释放AI在工业场景应用的决心。AI工厂包括一个算力中心和一个帮工厂升级为AI工厂的平台。”工业智能解决方案厂商格创东智副总裁、解决方案及产品中心总经理李楠向记者解读称,英伟达希望通过Omniverse带动硬件销售及场景落地,核心应用于仿真、数字孪生相关。
IDC中国高级研究经理杜雁泽也告诉记者,他认为AI工厂是英伟达AI视角下的一种叙事方式。英伟达的独特能力除了成熟架构、高可用性等,更重要的是很多工业软件公司产品都针对英伟达卡做过专属优化。英伟达在欧洲建立万卡AI工厂,则更多是对于此前宣传的“主权AI”的具体落地形式和承诺,英伟达正在寻找新的增长曲线。
英伟达做AI相关的工业仿真和数字孪生是一条独特的路线。李楠告诉记者,Omniverse提供了仿真的场景和空间,例如,人形机器人可以在仿真空间中训练以节省训练成本和时间。很多工厂建厂时也希望建一个数字孪生体,将机器模型和AGV(自动导向车)放进去跑,做预训练,这样实体工厂建设完成便能马上投入使用。英伟达做工业AI的逻辑并非直接做AI应用,而是提供虚拟仿真平台。这是AI在工业领域落地的核心关键软件。这样一个与AI结合的数字孪生平台,目前还没看到国内有产品与之对标。
搭软件平台、带动硬件销售可谓是英伟达的惯常做法。例如人形机器人领域已有不少厂商用英伟达的Isaac Sim、Omniverse等平台或套件来生成合成数据、在仿真环境中训练。有业内人士告诉记者,目前之所以人形机器人算力方案的选择不多,是因为机器人厂商对硬件厂商背后的生态系统十分看重。
不过,英伟达AI工厂概念并不涵盖工业AI的所有场景。相较于英伟达“搭平台”做仿真、数字孪生,而不做具体AI应用的做法,另一些厂商做的大模型和小模型应用,则聚焦于解决工厂运行过程中的一些现场的问题。工业AI有多种路线并行。
记者了解到,在大模型出来之前,工业领域已经在使用以小模型为代表的AI产品。杜雁泽表示,小模型主要覆盖两类场景,一是数据智能,涵盖设备故障运维、工艺优化等,二是视觉智能,涵盖AI质检、AI路径导引等。记者了解到,小模型应用场景还包括工业安防、安全检测等。
随着大模型出现,工业AI有了更多可探索的形式。不仅英伟达在仿真、数字孪生领域寻找市场机会,大模型普及也对工业企业产生影响。业内则在大模型和小模型之间做出选择。
工业场景铺开AI应用
工业领域AI渗透率并不高。IDC预计,工业领域IT基础设施或IT终端的AI渗透率将从当前的7%提升至2028年的25%。
这种情况下,AI的应用形式还在探索中。英伟达的仿真、数字孪生工厂路径之外,记者了解到,随着工业企业对AI的兴趣提升,大模型和小模型应用也在加速。
李楠告诉记者,格创东智2018年开始布局AI,当时服务的半导体和泛半导体客户数字化建设已度过最初的信息化建设阶段,着急要用AI来进一步解决产线和供应链上的问题。公司便给制造业工厂做AI转型,推出多因子分析、良率预测、图像识别、设备运行维护等领域的小模型。以缺陷监控为例,公司的AI-YMS能为半导体企业做良率和缺陷监控,基于AI模型及规则模型前置预测关键产品规则,减少工厂一半原本做相关分析的人力,相关工厂每年减少良率损失80万元。
“DeepSeek火了之后,很多公司坚定了自己建设AI应用的决心。甲方现在也在搭团队做AI,做智能体等应用。”李楠告诉记者,一个明显趋势是,随着数字化建设完成到一定程度,一些制造业企业的传统数字化预算减少,而随着对AI的兴趣愈加浓郁,又把AI预算单独列出来。
李楠告诉记者,在大模型催化下,一些AI应用已在加快部署。甲方制造业企业落地最快的是常见场景的应用,例如流程助手,可以在写PPT、文档、材料时快速用上。知识库应用也比较成熟,销售、授权、营销、研发等大量知识库已经可以用来做文档阅读和总结等。也有比较多用AI做经营决策类数据分析的案例。
不过,对于大模型如何应用,业内仍有一些困惑,业内还在大模型和小模型之间做选择。李楠告诉记者,在一些传统小模型已经能做的比较好的场景,大模型要怎么应用,大家可能还没想好。
一些业内人士认为,在工业领域,过去做小模型的做法还将延续。IDC中国助理研究总监崔凯表示,小模型资源需求较低、响应较快、部署灵活且建设成本较低,过去小模型在3C、装备、汽车领域应用较广,现在医药等行业也在铺开应用。
“大模型并不是包打天下。”崔凯表示,小模型在工业AI支出中的比例,未来还将占到70%,保守估计也有60%。“现在我们看到,AI在工厂落地应用起来,80%的情况还是靠小模型去解决现场实际的问题。”李楠告诉记者
在研发环节,小模型的作用依然明显。有企业已在用AI提高效率,用的并非参数量巨大的模型,而是参数量相对较小、聚焦某个领域的模型。
深圳一家合成生物技术公司高管告诉记者,合成生物研发周期长、成本高,开发一个酶或一套工艺可能需要几千万元甚至上亿元的资金投入。公司通过AI技术加快研发进度、降低成本,效率至少有指数级提升。具体而言,每年公司研发投入几千万元,其中投入AI技术的占比10%~20%,公司在英国和国内部署了三个团队,研究AI如何用于新物质筛选、酶和蛋白的筛选和菌株改造。
上述高管告诉记者,他试过一些外部大模型,但发现这些模型没有经过特定领域的数据训练,无法解决生产的具体问题。公司有合成生物领域的数据,自己从头研发模型,这并不是DeepSeek这类的大模型,但在细分领域中的表现比市面上可见的模型先进很多。
在小模型之外,大模型可以做什么,业内也在作出一些最新判断。
李楠认为,大模型比较有希望起到的作用是做小模型的串接,例如用智能体串接。以往人需要做的点击、导出数据等步骤,可以由智能体自主执行。
崔凯也认为,在一些制造业企业研、产、供、销、服系统相互独立的情况下,智能体做跨专业整合将有很大机会。他认为,大模型在工业中要获得更大的发展,一个要点是将多模态大模型和大语言模型结合起来。此外,在一些基于老师傅经验、未总结为完整方法论的场景,大模型也可能比小模型做得更好。
工业AI需要什么云
算力供应方面,英伟达这种建设万卡支撑的工业云、让多个制造商都能接入的方式是一种选择,但也不是唯一的选择。一些从业者告诉记者,在国内,基于信息安全的考虑,有一定实力的企业会更偏向于自建数据中心部署私有云。
上述合成生物技术公司高管告诉记者,公司对数据安全非常重视,即便在公司内部,数据也进行了分区物理隔离。基于数据安全考虑,公司自己训练的模型使用自己部署的算力。
李楠告诉记者,海外企业对公有云相对更开放,但预计公司的大型客户大概率还是会采用本地建设私有云数据中心的做法,算力仅用于集团内。整体而言,国内的大型工业企业部署AI应用,预计也更多采用私有云形式。其背后,AI涉及大量企业私密信息。
今年DeepSeek一体机销售火爆,深圳市科技创新局局长张林近日透露,今年推理机相关产品国内销售额将是千亿量级。有分析人士告诉记者,采买一体机的就包括工业企业,之所以一些机构不接入公有云使用DeepSeek,而是购买DeepSeek一体机,背后就有数据安全的考虑。“拿一体机测试一下,买过来就能用,虽然算力有限,但不需要搭一个私有云。这是一个过渡方案。”一名ICT行业资深分析人士告诉记者。
杜雁泽表示,据IDC调研,小模型使用的算力目前以厂商自建算力为主,包括传统服务器方式和私有云方式,有少部分使用公有云算力。
虽然英伟达在推动最新的GPU销售,但对于工业场景,并不一定需要万卡GPU集群的算力支撑。
李楠告诉记者,小模型依托的算力来源比较多元,包括云算力、厂商自己部署的算力、设备端搭载的算力。小模型对算力的要求相对没那么高。做视觉检测需要调GPU、用深度学习算法,很“吃”GPU资源;做数据分析用到机器学习,CPU足够;一些信号处理、设备数据维护的模型,普通CPU也足够。不同制造业企业对算力的需求也有所不同,很多工厂使用模型推理就足够,不需用到很高端的显卡,但像公司服务的TCL这类大型企业,自己训练大模型就需要投入大量算力。
杜雁泽表示,在模型训练、后训练、强化学习或设计、仿真等工业场景中,未来云中心算力仍会占据主要市场,另因工业对可靠性、及时性的要求,小参数模型需求会逐渐释放,使边缘算力也得到提升。
算力需求要进一步增长,也有赖于AI应用进一步渗透。有业内人士告诉记者,其背后需要克服的挑战包括工业专属数据缺少和工业场景碎片化,以及一些企业数字化建设仍未完成。杜雁泽认为,算力并不是当前阶段AI工业领域的瓶颈,工业对算力的需求大规模增长还需要2~3年时间。