“永远不要投资一家你无法理解的企业”
谷歌TPU大规模集群的核心秘密就在于OCS(光电路交换) 加上 3D Torus(三维环面) 拓扑结构。这套组合拳彻底颠覆了传统的英伟达 英伟达 InfiniBand + 胖树 (Fat Tree) 架构
英伟达 InfiniBand + 胖树 (Fat Tree) 架构像一个超级枢纽机场,想象一个巨大的国际机场。每一个登机口就是一台 GPU 服务器。胖树架构 (Fat Tree): 这是一种层级分明的网络结构。为什么叫“胖”树?因为越往树根(核心层)走,线路越粗(带宽越大),保证任何两个登机口之间都有足够宽的路,不会堵车。InfiniBand (IB): 这是机场的“超级跑道”。它是一种极低延迟的通信协议,支持 RDMA(直接内存访问),让 GPU 可以不经过 CPU,直接读写另一台 GPU 的内存。这种模式工作方式是(光-电-光):数据从 GPU 出来(电) -> 变成光(光模块) -> 传到交换机。交换机必须把光变回电,看一眼数据包要去哪,转发,然后再变成光发出去。
优点: 全连接(Non-blocking)。 理论上,网络里任何两台 GPU 都可以随时满速通话。
缺点: 费钱、费电。交换机里全是昂贵的芯片(Retimer/Switch ASIC),光电转换次数多,功耗巨大。
谷歌 OCS + 3D Torus 架构像魔方大厦想象一个巨大的魔方,魔方里每一个小方块就是一个 TPU。3D Torus (三维环面): 每个 TPU 不连中央交换机,而是直接用线连着它 上、下、左、右、前、后 的 6 个邻居。“环面”的意思是:最左边的芯片直接连最右边,形成闭环。数据像接力棒一样,一个传一个。
OCS (光电路交换): 这是谷歌的必杀技。在传统的 Torus 结构上,谷歌加了一层 OCS 交换机。工作方式: OCS 内部没有电芯片,全是 MEMS 微镜子。它不看数据包,只负责反射光。
动态变形: 就像给魔方装了传送门。如果训练一个模型发现“左边”和“右边”交互特别多,OCS 就可以转动镜子,瞬间搭一条光路,让它们直接连通。
优点: 省电、极快。 中间不需要“光-电-光”转换,就是光在飞。
缺点: 编程极其复杂,对编译器要求极高(需要预知数据流向)。
在通往 AGI 的道路上,能源效率是物理学的铁律。当集群规模达到 10万张卡 甚至 100万张卡 时,英伟达架构中“光模块和电交换机”消耗的电力将超过 GPU 本身。这在物理上是不可持续的。谷歌的 OCS 模式是“绿色”的。 光在传输过程中不耗电,只有镜子转动那一下耗电。同时3D Torus + OCS 的光速直连,在超大规模并行训练中,能把通信延迟压到物理极限。
以上是能耗和通讯延迟的区别,我最看好谷歌TPU道路最核心的观点就是:当你把谷歌 TPU v4/v5 大规模集群与人类大脑放在一起审视时,你会发现两者在设计哲学上有着惊人的“趋同进化”。
谷歌的工程师其实是在用硅基芯片、光纤和微振镜,试图重现碳基大脑的某些“高效能机制”。
以下是两者在运行机制上的四大相似之处:
1. 微观核心:“脉动”与“突触” (Systolic Array vs. Synapse)这是计算的最底层。
大脑的方式(生物学): 神经元之间通过突触连接。信号不是静止的,而是像波浪一样在神经网络中传递。当电信号流过突触时,会被突触的强弱(权重)瞬间放大或缩小,完成了一次“计算”。TPU 的方式(脉动阵列): TPU 的核心设计叫 Systolic Array(脉动阵列)。传统的 CPU/GPU 是把数据搬来搬去(读内存-计算-写内存)。TPU 则是让数据像心脏泵血(Systolic)一样,单向流动穿过成千上万个计算单元。数据流过的一瞬间,就和单元里的数字(权重)相乘。
2. 宏观连接:“白质”与“OCS光交换” (White Matter vs. OCS),这是两者最神似的地方,解决了“远距离通信”的问题。
大脑的方式: 大脑皮层有两套连接系统:灰质(局部): 神经元和隔壁邻居紧密连接,处理局部信息。
白质(长程): 是一束束神经纤维(轴突),像高速公路一样,把大脑左边的信号瞬间传到右边,或者把视觉区的信号传给语言区。
TPU 集群的方式:3D Torus(局部直连): 每个 TPU 芯片直接连着上下左右前后的 6 个邻居。这就像大脑的灰质,处理局部的高频通信。
OCS 光电路交换(长程动态): 那些 MEMS 反射镜就是 TPU 集群的白质。它能瞬间建立一条“光速通道”,让集群一端的芯片直接和另一端的芯片对话,而不需要经过中间无数个节点的转发。
3. 可塑性:“神经可塑性”与“动态拓扑” (Plasticity vs. Dynamic Topology)
大脑是活的,TPU 集群在某种意义上也是“活”的。
大脑的方式: 神经可塑性 (Neuroplasticity)。当你学习新技能时,大脑会物理上断开某些连接,建立新的连接。大脑的物理结构会随着任务而改变。TPU 集群的方式: 传统的英伟达集群,线插好了就定死了。但谷歌的 OCS 允许动态改变拓扑。如果是训练 GPT 这样的大语言模型,OCS 会把光路扭成一种形状。如果是做推荐系统,OCS 会把光路扭成另一种形状。
4. 规模效应:“功能分区”与“模型并行” (Functional Areas vs. Model Parallelism)
单个神经元毫无智慧,单个 TPU 芯片也存不下大模型。智慧涌现于规模之中。
大脑的方式: 大脑通过功能分区协作。视觉皮层处理图像,海马体负责记忆,额叶负责决策。成百上千亿个神经元分工明确,同时开火。TPU 集群的方式: 在训练万亿参数模型(如 Gemini)时,谷歌使用模型并行 (Model Parallelism)。这个 Pod(数千个芯片)模拟模型的“眼睛”(视觉层)。那个 Pod 模拟模型的“语言中枢”(Attention 层)。相似性: “分布式涌现”。两者都不是靠一个超级核心(单核 CPU)统领全局,而是靠海量、相对简单的单元,通过极高带宽的通信,协同产生复杂的智能。
人类大脑是经过数亿年进化出的、能耗比最高的“生物计算机”。谷歌 TPU 集群(尤其是 OCS+3D Torus 架构)则是人类工程师为了追求极致效率,在“硅基世界”里对大脑结构的一次笨拙但宏大的模仿。大脑用生物电和化学递质,实现了 20瓦 功耗下的通用智能。TPU 集群用电子和光子,虽然功耗还是兆瓦级,但它正在通过全光互联(模拟白质)和脉动阵列(模拟突触),一步步逼近大脑的运行效率极限。
这就是为什么全光互联不仅仅是一个硬件升级,它是 AI 算力通向“类脑效率”的必经之路。
目前算力市场是 $英伟达 (NVDA.US)$ 的天下。但为了实现真正的 AGI,未来的数据中心架构一定会向谷歌的“全光互联”方向演进。英伟达自己也在搞 NVLink Switch(尝试在机柜内减少光电转换),未来英伟达也极大概率会收购或研发类似 OCS 的技术来解决功耗墙问题。
Deepseek只是虚惊一场,Deepmind才是 $英伟达 (NVDA.US)$ 的“斯普特尼克时刻”
以下是我个人认为利好的股票
龙头 $谷歌-A (GOOGL.US)$ 人工智能时代的 $苹果 (AAPL.US)$
$博通 (AVGO.US)$ASIC和全光互联绝对龙头
$迈威尔科技 (MRVL.US)$Marvell在2021年豪掷100亿美元收购了 Inphi。 Inphi是光互联技术的鼻祖级公司,拥有最强的TIA(跨阻放大器)、Driver(驱动器) 和 硅光 技术储备。这让Marvell从一个单纯的数字芯片公司,变成了拥有光电模拟混合信号能力的巨头。在处理光信号的物理层技术上,Inphi的遗产是Marvell最硬的底气。(被严重低估)
$Lumentum (LITE.US)$它是谷歌 OCS 交换机内部 MEMS 阵列的主要供应商。没有它的镜子,就没有 OCS。
$Coherent (COHR.US)$ Coherent(收购了 Finisar 和 II-VI)同样拥有顶级的 MEMS 技术和 WSS(波长选择开关)
技术。
$Ciena (CIEN.US)$数据中心互联(DCI)与长距离传输之王
$Fabrinet (FN.US)$ OCS 的“组装工厂”
$Viavi Solutions (VIAV.US)$ 做滤光片(Filter)和测试设备的。Lumentum 造镜子需要用到 Viavi 的镀膜技术和材料,属于供应链上游的一环,价值量相对较小
A股中个人感觉不错的股票
$赛微电子 (300456.SZ)$全球MEMS代工龙头,拥有制造光开关所需微振镜的核心工艺。拥有全球领先的 MEMS 晶圆代工能力(瑞典 Silex 产线)。
$腾景科技 (688195.SH)$精密光学元件(如非球面透镜、Z-block组件、滤光片)。这些微小元件是 Lumentum 制造高端光模块(Transceiver)时必不可少的零部件。
$光库科技 (300620.SZ)$光库科技不仅是供应商,还收购了 Lumentum 位于意大利的铌酸锂高速调制器生产线。
$福晶科技 (002222.SZ)$福晶科技是全球非线性光学晶体(LBO/BBO)的绝对龙头(市占率极高)。
长飞光纤光缆 (06869.HK)拥有空芯反谐振光纤技术,适合超低延迟传输。
我个人认为有压力的股票
在传输距离上, 铜线在 224G/s 的高速下,传输距离只有 1-2米。再远信号就衰减没了。所以英伟达只能把 72 个 GPU 挤在一个机柜里。光纤传 100米 几乎没有损耗。全光互联打破了物理距离限制,不再需要把服务器挤在一起,也就不需要那套复杂的铜互联系统。在全光架构下,机柜内部那几千根昂贵的高速铜缆(DAC/ACC)直接被光纤跳线取代了。
备注:本文只是分享自己一点选股思路,不构成任何投资建议,最近个股涨幅巨大,请大家注意风险!