• 最近访问:
发表于 2025-11-30 12:31:54 东方财富Android版 发布于 广东
谷歌挑战英伟达的霸主地位及兴起,国内的赛微电子与谷歌是最紧密的合作关系,将是其中最受益之一的上市公司,谷歌的强大Ai应用及太空航天商业,将带来冲击十万亿市值,赛微电子也会跟随冲击千亿市值,

发表于 2025-11-30 03:09:23 发布于 湖南

$赛微电子(SZ300456)$   

“永远不要投资一家你无法理解的企业”


谷歌TPU大规模集群的核心秘密就在于OCS(光电路交换) 加上 3D Torus(三维环面) 拓扑结构。这套组合拳彻底颠覆了传统的英伟达 英伟达 InfiniBand + 胖树 (Fat Tree) 架构


英伟达 InfiniBand + 胖树 (Fat Tree) 架构像一个超级枢纽机场,想象一个巨大的国际机场。每一个登机口就是一台 GPU 服务器。胖树架构 (Fat Tree): 这是一种层级分明的网络结构。为什么叫“胖”树?因为越往树根(核心层)走,线路越粗(带宽越大),保证任何两个登机口之间都有足够宽的路,不会堵车。InfiniBand (IB): 这是机场的“超级跑道”。它是一种极低延迟的通信协议,支持 RDMA(直接内存访问),让 GPU 可以不经过 CPU,直接读写另一台 GPU 的内存。这种模式工作方式是(光-电-光):数据从 GPU 出来(电) -> 变成光(光模块) -> 传到交换机。交换机必须把光变回电,看一眼数据包要去哪,转发,然后再变成光发出去。


优点: 全连接(Non-blocking)。 理论上,网络里任何两台 GPU 都可以随时满速通话。


缺点: 费钱、费电。交换机里全是昂贵的芯片(Retimer/Switch ASIC),光电转换次数多,功耗巨大。


谷歌 OCS + 3D Torus 架构像魔方大厦想象一个巨大的魔方,魔方里每一个小方块就是一个 TPU。3D Torus (三维环面): 每个 TPU 不连中央交换机,而是直接用线连着它 上、下、左、右、前、后 的 6 个邻居。“环面”的意思是:最左边的芯片直接连最右边,形成闭环。数据像接力棒一样,一个传一个。


OCS (光电路交换): 这是谷歌的必杀技。在传统的 Torus 结构上,谷歌加了一层 OCS 交换机。工作方式: OCS 内部没有电芯片,全是 MEMS 微镜子。它不看数据包,只负责反射光。


动态变形: 就像给魔方装了传送门。如果训练一个模型发现“左边”和“右边”交互特别多,OCS 就可以转动镜子,瞬间搭一条光路,让它们直接连通。


优点: 省电、极快。 中间不需要“光-电-光”转换,就是光在飞。


缺点: 编程极其复杂,对编译器要求极高(需要预知数据流向)。


在通往 AGI 的道路上,能源效率是物理学的铁律。当集群规模达到 10万张卡 甚至 100万张卡 时,英伟达架构中“光模块和电交换机”消耗的电力将超过 GPU 本身。这在物理上是不可持续的。谷歌的 OCS 模式是“绿色”的。 光在传输过程中不耗电,只有镜子转动那一下耗电。同时3D Torus + OCS 的光速直连,在超大规模并行训练中,能把通信延迟压到物理极限。


以上是能耗和通讯延迟的区别,我最看好谷歌TPU道路最核心的观点就是:当你把谷歌 TPU v4/v5 大规模集群与人类大脑放在一起审视时,你会发现两者在设计哲学上有着惊人的“趋同进化”。


谷歌的工程师其实是在用硅基芯片、光纤和微振镜,试图重现碳基大脑的某些“高效能机制”。


以下是两者在运行机制上的四大相似之处:


1. 微观核心:“脉动”与“突触” (Systolic Array vs. Synapse)这是计算的最底层。


大脑的方式(生物学): 神经元之间通过突触连接。信号不是静止的,而是像波浪一样在神经网络中传递。当电信号流过突触时,会被突触的强弱(权重)瞬间放大或缩小,完成了一次“计算”。TPU 的方式(脉动阵列): TPU 的核心设计叫 Systolic Array(脉动阵列)。传统的 CPU/GPU 是把数据搬来搬去(读内存-计算-写内存)。TPU 则是让数据像心脏泵血(Systolic)一样,单向流动穿过成千上万个计算单元。数据流过的一瞬间,就和单元里的数字(权重)相乘。


2. 宏观连接:“白质”与“OCS光交换” (White Matter vs. OCS),这是两者最神似的地方,解决了“远距离通信”的问题。


大脑的方式: 大脑皮层有两套连接系统:灰质(局部): 神经元和隔壁邻居紧密连接,处理局部信息。


白质(长程): 是一束束神经纤维(轴突),像高速公路一样,把大脑左边的信号瞬间传到右边,或者把视觉区的信号传给语言区。


TPU 集群的方式:3D Torus(局部直连): 每个 TPU 芯片直接连着上下左右前后的 6 个邻居。这就像大脑的灰质,处理局部的高频通信。


OCS 光电路交换(长程动态): 那些 MEMS 反射镜就是 TPU 集群的白质。它能瞬间建立一条“光速通道”,让集群一端的芯片直接和另一端的芯片对话,而不需要经过中间无数个节点的转发。


3. 可塑性:“神经可塑性”与“动态拓扑” (Plasticity vs. Dynamic Topology)


大脑是活的,TPU 集群在某种意义上也是“活”的。


大脑的方式: 神经可塑性 (Neuroplasticity)。当你学习新技能时,大脑会物理上断开某些连接,建立新的连接。大脑的物理结构会随着任务而改变。TPU 集群的方式: 传统的英伟达集群,线插好了就定死了。但谷歌的 OCS 允许动态改变拓扑。如果是训练 GPT 这样的大语言模型,OCS 会把光路扭成一种形状。如果是做推荐系统,OCS 会把光路扭成另一种形状。


4. 规模效应:“功能分区”与“模型并行” (Functional Areas vs. Model Parallelism)


单个神经元毫无智慧,单个 TPU 芯片也存不下大模型。智慧涌现于规模之中。


大脑的方式: 大脑通过功能分区协作。视觉皮层处理图像,海马体负责记忆,额叶负责决策。成百上千亿个神经元分工明确,同时开火。TPU 集群的方式: 在训练万亿参数模型(如 Gemini)时,谷歌使用模型并行 (Model Parallelism)。这个 Pod(数千个芯片)模拟模型的“眼睛”(视觉层)。那个 Pod 模拟模型的“语言中枢”(Attention 层)。相似性: “分布式涌现”。两者都不是靠一个超级核心(单核 CPU)统领全局,而是靠海量、相对简单的单元,通过极高带宽的通信,协同产生复杂的智能。


人类大脑是经过数亿年进化出的、能耗比最高的“生物计算机”。谷歌 TPU 集群(尤其是 OCS+3D Torus 架构)则是人类工程师为了追求极致效率,在“硅基世界”里对大脑结构的一次笨拙但宏大的模仿。大脑用生物电和化学递质,实现了 20瓦 功耗下的通用智能。TPU 集群用电子和光子,虽然功耗还是兆瓦级,但它正在通过全光互联(模拟白质)和脉动阵列(模拟突触),一步步逼近大脑的运行效率极限。


这就是为什么全光互联不仅仅是一个硬件升级,它是 AI 算力通向“类脑效率”的必经之路。


目前算力市场是 $英伟达 (NVDA.US)$ 的天下。但为了实现真正的 AGI,未来的数据中心架构一定会向谷歌的“全光互联”方向演进。英伟达自己也在搞 NVLink Switch(尝试在机柜内减少光电转换),未来英伟达也极大概率会收购或研发类似 OCS 的技术来解决功耗墙问题。


Deepseek只是虚惊一场,Deepmind才是 $英伟达 (NVDA.US)$ 的“斯普特尼克时刻”


以下是我个人认为利好的股票


龙头 $谷歌-A (GOOGL.US)$ 人工智能时代的 $苹果 (AAPL.US)$


$博通 (AVGO.US)$ASIC和全光互联绝对龙头


$迈威尔科技 (MRVL.US)$Marvell在2021年豪掷100亿美元收购了 Inphi。 Inphi是光互联技术的鼻祖级公司,拥有最强的TIA(跨阻放大器)、Driver(驱动器) 和 硅光 技术储备。这让Marvell从一个单纯的数字芯片公司,变成了拥有光电模拟混合信号能力的巨头。在处理光信号的物理层技术上,Inphi的遗产是Marvell最硬的底气。(被严重低估)


$Lumentum (LITE.US)$它是谷歌 OCS 交换机内部 MEMS 阵列的主要供应商。没有它的镜子,就没有 OCS。


$Coherent (COHR.US)$ Coherent(收购了 Finisar 和 II-VI)同样拥有顶级的 MEMS 技术和 WSS(波长选择开关)


技术。


$Ciena (CIEN.US)$数据中心互联(DCI)与长距离传输之王


$Fabrinet (FN.US)$ OCS 的“组装工厂”


$Viavi Solutions (VIAV.US)$ 做滤光片(Filter)和测试设备的。Lumentum 造镜子需要用到 Viavi 的镀膜技术和材料,属于供应链上游的一环,价值量相对较小


A股中个人感觉不错的股票


$赛微电子 (300456.SZ)$全球MEMS代工龙头,拥有制造光开关所需微振镜的核心工艺。拥有全球领先的 MEMS 晶圆代工能力(瑞典 Silex 产线)。


$腾景科技 (688195.SH)$精密光学元件(如非球面透镜、Z-block组件、滤光片)。这些微小元件是 Lumentum 制造高端光模块(Transceiver)时必不可少的零部件。


$光库科技 (300620.SZ)$光库科技不仅是供应商,还收购了 Lumentum 位于意大利的铌酸锂高速调制器生产线。


$福晶科技 (002222.SZ)$福晶科技是全球非线性光学晶体(LBO/BBO)的绝对龙头(市占率极高)。


长飞光纤光缆 (06869.HK)拥有空芯反谐振光纤技术,适合超低延迟传输。


我个人认为有压力的股票


在传输距离上, 铜线在 224G/s 的高速下,传输距离只有 1-2米。再远信号就衰减没了。所以英伟达只能把 72 个 GPU 挤在一个机柜里。光纤传 100米 几乎没有损耗。全光互联打破了物理距离限制,不再需要把服务器挤在一起,也就不需要那套复杂的铜互联系统。在全光架构下,机柜内部那几千根昂贵的高速铜缆(DAC/ACC)直接被光纤跳线取代了。


备注:本文只是分享自己一点选股思路,不构成任何投资建议,最近个股涨幅巨大,请大家注意风险!

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500