当地时间12月24日,AI芯片初创公司Groq宣布已与英伟达就其推理技术达成非独家许可协议。根据协议条款,Groq创始人Jonathan Ross、总裁Sunny Madra及其他核心团队成员将加入英伟达,共同推进授权技术的升级与规模化应用。
Groq将继续作为独立公司运营,Simon Edwards将接任首席执行官职务。Groq云服务也将保持正常运行,不受此次合作影响。
不过,此前有报道称,英伟达已收购Groq,完成其规模最大的一笔收购。Groq投资方之一Disruptive的CEO Alex Davis透露,英伟达已同意以200亿美元(约合1402亿元人民币)现金收购Groq资产。
对此,英伟达向21世纪经济报道记者回应称,“我们并未收购 Groq。我们只是获得了Groq知识产权的非独家授权,并从Groq团队中聘请了工程人才加入我们。我们将共同致力于提供世界领先的加速计算技术。”
记者获得的一封英伟达CEO黄仁勋在发给员工的电子邮件中显示同样的说法。不过,双方未披露该交易的财务条款。
英伟达“收编”潜在竞争者
Groq由谷歌前员工Jonathan Ross在2016年创立,主要针对云计算市场开发AI芯片,其主要成员曾参与研发谷歌的张量处理单元(Tensor Processing Unit,TPU),公司成立后推出首个云端推理芯片GroqChip,可以实现16个芯片间互连并配置230 MB SRAM(静态随机存储器),算力可达750 TOPS。
在成立之初,Groq就确定了“编译器优先”的策略,即由官方提供一个帮助客户拆分计算任务、最大化并行计算的软件,提升推理效率。Groq还提出 “LPU芯片”概念,即“语言处理单元”,专门用于大语言模型推理任务。该公司称,LPU芯片速度比H100快10倍,成本仅为其十分之一,以满足全球企业对“实时、低延迟”的AI推理服务的渴求。
LPU的一大重要特点是采用了SRAM,其速度比GPU所用的存储器快约20倍。Jonathan Ross曾表示,采用SRAM意味着其芯片的生产和部署速度比图形处理器更快,功耗也更低,而图形处理器通常能耗很高,且对于训练模型更为必要。
2021年4月,Groq获D1 Capital、老虎环球基金等机构3亿美元融资。估值突破10亿美元,正式晋升独角兽。 2024年3月,Groq收购 AI 解决方案初创公司 Definitive Intelligence,并组建 GroqCloud 部门,直接向开发者提供云端算力服务。
2024年是 Groq 真正走向大众视野的一年,AI需求重心从训练到推理的转变,给了Groq这样的芯片厂商机会。凭借在大模型推理速度上的惊人表现,Groq融资节奏明显加快。2024年8月,2025年2月和9月,Groq分别完成三轮融资,引入思科、三星、德国电信等产业投资者,其最新一轮融资后的估值达到69亿美元。
一路走来,Groq 已成为英伟达在推理市场有力的潜在竞争者之一。
不过,英伟达在市场仍保持领先地位,在生成式AI热潮下,英伟达凭借多年布局成为算力底座,芯片供不应求。无论是老对手AMD、英特尔,还是新生代创业公司Groq、Cerebras等,纷纷瞄准AI赛道加码,亦欲分羹AI芯片市场。
对于以Groq为代表的AI芯片初创公司带来的挑战,在2024年3月的GTC大会期间,黄仁勋称,Groq等专用AI芯片被设计成用来执行非常具体任务的计算机有其适用场景,但将难以从软件领域的创新速度中获益。
黄仁勋进一步表示,英伟达的商业模式是将完整的数据中心方案分割为不同的模块,再由客户基于其自身的网络、存储、后台控制面板等因素,作出具体采购选择。这并非传统的芯片销售,而是设计数据中心,以将英伟达的数据中心方案集成至他人的数据中心。
补齐推理算力拼图?
对于英伟达为何收购Groq资产,市场上也有不同解读,基于Groq的技术能力和市场表现,有分析认为英伟达将从技术和人才上补齐在AI推理领域的版图。
从市场格局来看,在训练端,英伟达已无敌手。但在推理端,由于对成本和能效的极致追求,技术路线呈现出百花齐放的态势,Cerebras、Groq以及各大云厂商自研芯片均在试图通过不同架构分食蛋糕。
目前,英伟达的主力产品(如Blackwell系列)极度依赖台积电的CoWoS先进封装和HBM(高带宽内存)。然而,随着大模型应用爆发,推理成本和延迟成为瓶颈。Groq的技术路线展现了另一种思路:其LPU架构摒弃了外部HBM,直接采用片上SRAM(静态随机存取存储器)。
这一设计带来的性能差异是数量级的。Groq披露的数据显示,Groq芯片的片上内存带宽高达80TB/s以上,而目前顶尖GPU采用的HBM(高带宽内存)带宽仅约为8TB/s。
科技行业分析师Max Weinbach指出,SRAM的速度是HBM的10倍,更关键的是,Groq路线绕过了对台积电CoWoS产能的依赖,消除了昂贵的封装瓶颈。
通过部分“收编”Groq,英伟达不仅整合了一个潜在强力技术对手,规避了反垄断风险,还可以在未来的AI产能大战中,开辟一条不依赖HBM供应链的新战线,专门针对高频、低延迟推理市场。
除了技术专利,Groq 拥有的技术工程团队被视为英伟达此次交易中更为核心的资产。事实上,英伟达与这支源自谷歌的顶尖技术团队颇有渊源。
Groq创始人Jonathan Ross毕业于纽约大学,师从前Meta首席AI科学家杨立昆,曾在谷歌参与TPU早期研发,负责设计并实现第一代TPU芯片的核心架构与关键模块。而Groq的早期架构师Dennis Abts已于2022年加入英伟达,此次交易将把Groq剩余的“技术灵魂人物”全数收编,有助于英伟达将Groq的技术与现有的英伟达生态进行深层整合,修补其在实时推理领域的短板。
值得注意的是,英伟达本次获取Groq人才和技术授权的手段,是近年来被硅谷称为“收购式招聘(acqui-hire deals )”的新型交易模式。
在此之前,AI领域已掀起一股此类授权合作的热潮。Meta Platforms向Scale AI注资140 亿美元,通过这笔交易,成功将这家初创公司的 CEO Alexandr Wang招致麾下,由其挂帅Meta的AI业务。去年,Alphabet旗下的谷歌也采取了类似模式,在获得Character.AI技术授权的同时,吸纳了其高管团队。微软此前与Inflection AI达成的协议也如出一辙。
也有分析人士认为,传统的初创公司要么以上市为目标,要么以被收购为目标,而新型的 “收购式招聘”交易可能会让一些初创公司员工失去机会,只有少数拥有优秀人工智能技能的员工和创始人从中受益。
当地时间12月24日,英伟达收于188.61美元/股,盘后股价微跌0.32%。