天工低成本模型R1V4(30b)实现了对Qwen3-VL(30B)和Gemini 2.5 Flash的全面超越
来自能源的革命的雪球专栏

核心事实梳理
技术成果:Skywork R1V4(30B)在多模态感知和深度研究任务上,性能全面超越Qwen3-VL 30B和Gemini 2.5 Flash
成本效率:仅用64块A800 GPU训练12小时(768 GPU小时),且未使用RL强化学习
战略定位:首个闭源R1系列模型,专注"图像交错思考"和"deep research"场景
逻辑影响分析
第一层:技术能力验证(直接影响)
研发效率突破:768 GPU小时的训练成本在业界极低(通常同类模型需数万GPU小时),说明昆仑万维在训练框架、数据工程和模型架构优化上掌握核心技术,这种"低成本高性能"路径是其独特竞争力的实证
多模态技术闭环:从开源模型到闭源商业模型的转化能力得到验证,表明技术栈已成熟到可支撑产品化
第二层:商业价值传导(中期影响)
降本增效:若R1V4用于昆仑万维自有产品(天工AI搜索、游戏、社交等),推理成本优势显著,边际成本下降将直接改善相关业务毛利率
差异化竞争:"图像交错思考+deep research"的垂直定位,避开了通用大模型的红海竞争,可能在科研、金融、法律等专业场景形成高溢价
闭源商业化:转向闭源意味着探索API调用、企业授权等直接变现模式,技术价值可更快转化为收入
第三层:战略信号意义(长期影响)
资本效率叙事:在"百模大战"烧钱背景下,"小预算出高性能"的故事极易获得二级市场认可,可能重塑市场对其AI投入产出比的预期
人才密度证明:极小的精英团队(从GPU数量推断)实现SOTA成果,说明核心团队技术实力强劲,有利于后续融资和招聘
技术路线话语权:若该效率优势可持续,昆仑万维可能成为"高效多模态训练"新范式的标杆,获取生态位优势
风险与验证点
数据信源:需确认评测基准的客观性和测试集是否泄露,以及"全面超越"是否涵盖所有关键场景
成本口径:768 GPU小时仅是训练成本,是否包含前期数据准备、架构探索等预研成本
闭源动机:是因技术保护还是模型效果尚不稳定需要持续打磨?需观察后续商业落地速度
结论:若信息属实,这是昆仑万维AI战略从"投入期"转向"产出期"的关键信号,技术效率优势和商业化路径清晰化将实质性改善其估值逻辑,但需持续跟踪模型真实落地案例和收入贡献。$昆仑万维(SZ300418)$ $视觉中国(SZ000681)$ $谷歌A(GOOGL)$
作者:能源的革命
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
风险提示:本文所提到的观点仅代表个人的意见,所涉及标的不作推荐,据此买卖,风险自负。