• 最近访问:
发表于 2025-08-22 23:20:50 东方财富iPhone版 发布于 江苏
全世界的ai科学家都说deepseek牛逼,你个小散却说他是个笑话,你可真是个笑话
发表于 2025-08-22 17:43:19 发布于 广东

UE8M0核心是此方法是通过优化整数计算单元(非浮点单元),适配国产芯片制程瓶颈,提升面积效率。核心优势在于将复杂的浮点乘法简化为整数加法。(重点是整数计算单元。)

首先,FP8是8位浮点数(Floating Point 8-bit)的简称,是一种低精度数值格式。相比传统的FP16(16位浮点)和FP32(32位浮点),FP8通过减少数据位宽(仅用8位表示一个数)来提升计算效率,减少内存占用和通信带宽需求。FP8主要有两种编码格式:E4M3(4位指数+3位尾数+1位符号位)和E5M2(5位指数+2位尾数+1位符号位)。E4M3精度较高但动态范围小,E5M2动态范围大但精度较低。

而UE8M0是DeepSeek针对国产芯片优化的一种特殊FP8格式。根据的解释,UE8M0中的"U"代表无符号(Unsigned,只能表示0或正数),"E8"表示8位指数位,"M0"表示0位尾数位。这种设计使得它只能表示2的n次方(从2^0到2^255),但带来了显著的计算优势。

UE8M0的核心优势在于将复杂的浮点乘法简化为整数加法。因为当两个都是2的幂次的数相乘时(如2^m * 2^n),结果就是2^(m+n),这只需做指数位的加法即可。这大大降低了计算复杂度,尤其适合国产芯片在制程受限的情况下提升算力效率。

DeepSeek在DeepSeek-V3.1模型中采用了UE8M0 FP8技术,官方表示这是"针对即将发布的下一代国产芯片设计"的。这意味着这项技术优化特别适配华为昇腾、砺算、寒武纪、摩尔线程等国产AI芯片的架构特点(尤其是自研架构适配占据优势,因为这需要跟硬件底层强关联),能帮助国产芯片在算力上实现追赶。

画重点:此方法是通过优化整数计算单元(非浮点单元),适配国产芯片制程瓶颈,提升面积效率。


追加内容

发布于

东芯股份吧

东方财富Android版

分享至:

微信

朋友圈

微博

郑重声明:用户在社区发表的所有信息将由本网站记录保存,仅代表个人观点,与本网站无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500