• 最近访问:
发表于 2025-08-24 00:58:25 东方财富Android版 发布于 广东
转发
发表于 2025-08-23 00:17:37 发布于 重庆

$东芯股份(SH688110)$  

我们接下来讲讲砺算科技的GPU牛逼在哪里。

(1)首先,砺算表示其TrueGPU架构包含完全自研的指令集(ISA),从底层数学公式推导开始设计,不继承任何现有商业ISA(如x86、ARM或Imagination PowerVR),而且还参考了已有 ISA 的优缺点进行优化。所以用的IP授权,意味着怎么设计,怎么加模块,都不用和别人商量,也不用像其他公司支付庞大的授权费。

开发一个全新的指令集是非常困难的,难在既要解决技术上的 "造桥" 问题,又要突破生态上的 "孤岛" 困境

指令集相当于计算机的 "语言",每个指令就是一个 "单词"。比如要设计一个 "加法" 指令,你得规定它的格式(比如是add r1, r2还是sum r3 = r1 + r2),还要确保硬件电路能准确识别并执行这个操作。这就像制定语法规则,既要让计算机能快速理解,又要让程序员用起来方便。

指令集的设计直接影响芯片性能。比如,如果指令太复杂(类似英语的长难句),硬件实现会很麻烦;但如果指令太简单(类似单词拼凑),程序员就得写很多代码,效率低下。这就像设计一门新语言,既要让它能表达复杂思想,又要让使用者轻松掌握。

即使指令集设计得再好,如果没有软件支持,芯片就无法发挥作用。这就像一个新国家成立后,需要建立自己的法律、教育、医疗体系。开发者需要为新指令集编写编译器、操作系统、应用程序等,而这需要大量时间和资源。

但生态的问题砺算不存在,因为砺算的TrueISA 指令集专门为图形渲染和 AI 计算设计,在软件接口层兼容了 DirectX、Vulkan 等主流标准,用这个显卡直接就能玩已有的游戏。

(2)砺算科技采用 6nm 制程,是目前国内量产芯片中最先进的工艺之一,它的厉害之处首先体现在 “空间利用率” 上 —— 在同样大小的芯片面积里,能比上一代 14nm 工艺多塞下近 3 倍的晶体管,这些晶体管就像芯片里的 “工人”,数量越多,处理数据的能力就越强。

对 GPU 来说,这意味着能同时跑更多图形渲染任务和 AI 计算,比如在《黑神话:悟空》这样的 3A 游戏里,既能快速绘制复杂的场景细节,又能实时用 AI 优化画质,而这在 14nm 工艺的芯片上几乎不可能同时做到。

从实际性能看,6nm 工艺让砺算的 7G100 系列 GPU 实现了 “越级挑战”。它的图形渲染能力接近 RTX 4060,而功耗却低了 15%,这种能效比的提升很大程度上要归功于更先进的制程。

说到底,6nm 制程的厉害不仅在于 “先进”,更在于 “能用好”。很多国产芯片虽然能用上先进工艺,但往往因为设计能力不足,发挥不出制程优势。

(3)第二,自研TrueGPU天图架构。

这种架构最关键的创新是把图形渲染和 AI 计算 “拧成了一股绳”。传统 GPU 里,图形处理和 AI 任务往往是分开的,像两个各干各的车间;而天图架构通过硬件级的智能调度系统,让这两种任务能动态共享计算资源,比如玩游戏时自动把更多算力分给画面渲染,跑 AI 绘图时又能快速切换到 AI 模式,就像一个灵活的车间,能根据订单随时调整生产线,效率比传统设计提升不少。

这种架构重构了渲染流程,我们现在打那种3D游戏,或者看3D电影,里面的每个"物品",或者人物,渲染(或者说"画出来")都是从点到线,从线到面,最后从面到体的,而且这个面只能是"三角形",我们看到的那些画面,其实都是由密密麻麻的三角形拼接而来的。

以前画 3D 画面必须按顺序画三角形(比如先画屋顶再画墙壁,存在一个依赖关系,即使后续三角形与前序无依赖关系也需等待),砺算科技的智能乱序渲染,现在可以同时画多个不相关的部分(比如同时画屋顶和窗户),复杂场景渲染速度快 50%。

(4)软件技术栈。砺算科技的软件技术栈是一套围绕 TrueGPU 架构量身打造的 “软硬协同系统”,核心目标是让自主设计的硬件能真正 “用起来、用得好”。它不像有些国产芯片那样依赖外部开源工具或第三方驱动,而是从底层编译器到上层应用适配全链条自主开发。

这套技术栈最关键的 “粘合剂” 是自研驱动程序,它扮演着 “翻译官” 的角色,一边理解 TrueISA 指令集的独特逻辑,把硬件的计算能力转化为软件能调用的接口;另一边又能 “听懂” 主流应用的需求,比如游戏引擎发出的渲染指令、AI 框架的计算请求,让《黑神话:悟空》这类 3A 大作,不用重写代码就能在砺算 GPU 上流畅运行。这种 “双向翻译” 能力,解决了很多自研芯片 “硬件强、软件弱” 的痛点。

它的优化速度很有特点,通过一套自动化测试和适配工具,新游戏发布后能在 48 小时内完成驱动调优,比传统国产 GPU 的适配周期缩短 90% 以上。

这背后是预先建立的游戏场景数据库,里面存储了不同类型游戏的渲染规律,驱动能根据这些规律自动调整硬件资源分配 —— 比如射击游戏侧重帧率稳定性,驱动就优先调度图形计算单元;策略游戏画面复杂,就自动开启 AI 超分辨率技术提升画质,这种 “对症下药” 的能力让硬件性能能精准匹配应用需求。

同时,它没有为了自主而封闭,而是主动兼容行业通用标准。比如支持 DirectX 12、Vulkan 1.3 这些图形 API,OpenCL 3.0 计算框架,让开发者不用学习新工具就能上手;针对国产软件生态,还专门做了统信 UOS、麒麟 OS 等系统的深度适配,以及剪映、CAD 等国产应用的优化,形成 “自主核心 + 开放兼容” 的混合生态,既保证了技术自主权,又降低了用户的迁移成本。

总结一下他牛逼在哪里,首先是自研的从上到下的技术栈,从芯片设计,指令集设计,驱动设计都是自己搞的,我们上面也已经说了芯片设计的难度;其次就是6nm工艺,目前说流片已经成功了,已启动向行业客户的送样流程;最后软件栈已经做好了兼容现有生态。

我看了一些网上的观点,比如说消费级的GPU本就是一个存量市场,现在大家用的英伟达GPU都还能用,短期也不会有太大的更换需求,还有包括后面量产、良率等等问题。

这些其实说的都没有错,但量产、良率这些每个新技术都会面临,至于需求,如果后面量产后价格降下来了,也可能促进其他行业新的发展,比如云游戏、云手机之类的。

这里的炒作更看重的还是国产替代,毕竟要做出这么难的东西,实力得很强吧,有这样的能力,意味着在他还可以扩展其他的芯片业务,比如自己开始做IP授权等等。

当然,这些前提都得是真的,大家也可以去看下他们团队背景啥的,剩下就自己评估和斟酌一下吧。如果真那么强的话,这个芯片上市后我也去买一块。。。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500