
UE8M0核心是此方法是通过优化整数计算单元(非浮点单元),适配国产芯片制程瓶颈,提升面积效率。核心优势在于将复杂的浮点乘法简化为整数加法。(重点是整数计算单元。)
首先,FP8是8位浮点数(Floating Point 8-bit)的简称,是一种低精度数值格式。相比传统的FP16(16位浮点)和FP32(32位浮点),FP8通过减少数据位宽(仅用8位表示一个数)来提升计算效率,减少内存占用和通信带宽需求。FP8主要有两种编码格式:E4M3(4位指数+3位尾数+1位符号位)和E5M2(5位指数+2位尾数+1位符号位)。E4M3精度较高但动态范围小,E5M2动态范围大但精度较低。
而UE8M0是DeepSeek针对国产芯片优化的一种特殊FP8格式。根据的解释,UE8M0中的"U"代表无符号(Unsigned,只能表示0或正数),"E8"表示8位指数位,"M0"表示0位尾数位。这种设计使得它只能表示2的n次方(从2^0到2^255),但带来了显著的计算优势。
UE8M0的核心优势在于将复杂的浮点乘法简化为整数加法。因为当两个都是2的幂次的数相乘时(如2^m * 2^n),结果就是2^(m+n),这只需做指数位的加法即可。这大大降低了计算复杂度,尤其适合国产芯片在制程受限的情况下提升算力效率。
DeepSeek在DeepSeek-V3.1模型中采用了UE8M0 FP8技术,官方表示这是"针对即将发布的下一代国产芯片设计"的。这意味着这项技术优化特别适配华为昇腾、砺算、寒武纪、摩尔线程等国产AI芯片的架构特点(尤其是自研架构适配占据优势,因为这需要跟硬件底层强关联),能帮助国产芯片在算力上实现追赶。
画重点:此方法是通过优化整数计算单元(非浮点单元),适配国产芯片制程瓶颈,提升面积效率。
追加内容
发布于
东芯股份吧
东方财富Android版
分享至:
微信
朋友圈
微博
郑重声明:用户在社区发表的所有信息将由本网站记录保存,仅代表个人观点,与本网站无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!