对标LMArena:永信至诚AI数字风洞“测评+健康管理”双轮驱动的成长密码
手机性能测评看“安兔兔”,AI大模型能力比拼则绕不开估值17亿美元的LMArena。这个被称为AI领域“安兔兔”的平台,近期宣布完成A轮融资,融资额为1.5亿美元,该轮融资由Felicis Ventures和加州大学伯克利分校旗下的投资基金UC Investments领投,A16Z、光速创投、The House Fund、LDVP、Kleiner Perkins等美国知名VC跟投,投后估值达17亿美元,估值在七个月内翻了三倍,快速晋升独角兽。这个只有29名员工的平台以用户匿名投票对战模式量化测评模型多维度能力,成为海外AI大模型行业测评基准,也成为海外资本新宠。
那么国内有没有ai测评公司可以对标LMArena呢?答案是有的,它就是科创板上市公司永信至诚。
永信至诚推出的AI大模型安全测评数字风洞平台,不仅以自研ISAC四大测评维度(智能度、安全度、匹配度、一致度)对标LMArena核心逻辑,更创新性延伸出AI数字健康管理能力,形成“测评+健康管理”双轮驱动优势,在国内分散的竞争格局中凸显稀缺价值,为投资者揭示了AI安全赛道的成长潜力。
当前国内AI测评赛道呈“竞争分散、布局单一”格局,尚未形成统一标准。玩家主要分为三类:传统测试厂商将AI测评作为延伸业务,缺乏针对性技术积累;互联网大厂的评估工具对外开放有限,难以满足全行业需求;少数创业公司聚焦单一跑分环节,无安全基因与全流程服务能力。多数玩家停留在“单点测评”阶段,在大模型安全测评与持续健康管理的结合上存在明显供给缺口,这为永信至诚的差异化突破提供了广阔空间。
在核心测评能力上,永信至诚完全不弱于LMArena。其AI大模型安全测评“数字风洞”平台依托春秋AI大模型,构建涵盖100余个基础数据集、超600万条测评用例的评估体系,集成2万余种攻击载荷模板与100余万条安全检测数据,通过独创的“数字风洞ISAC24”测试标准,将四大维度评估落到实处。目前已接入接入大模型数量超过60个,包括deepseek、chatgpt、llama、通义千问、豆包等,涵盖了开源与商用模型,服务覆盖国央企、高新技术企业、院校、地方政府等多元客户,形成与LMArena的直接对标及本土适配优势。
永信至诚的核心稀缺性,在于国内稀缺的“测评+全生命周期健康管理”闭环商业模式。其创新性将AI大模型视为“有机体”,首创了“原生安全”理念,即从AI大模型的内在架构、数据处理、算法训练、工作流量等方面进行安全管理,确保安全从模型的源头就被构建起来。为此,公司围绕AI大模型构建、部署到运营的各个阶段,构建了针对AI大模型整个生命周期的风险管理机制。该机制以实现AI大模型的原生安全为目的,帮助开发、使用AI智能数字系统的政企用户开展多维风险测评与验证。其推出的“元方”原生安全大模型一体机,就是这一理念实现规模化、商业化落地的最好实践,精准解决了企业私有化部署痛点,这一产品形态在国内处于领先地位。
回归投资本质,永信至诚的价值在于超越LMArena的单一逻辑,在国内供给缺口下构建起难以复制的壁垒。与LMArena的收入、估值对比更凸显其成长空间:LMArena凭单一测评业务估值达17亿美元(约120亿元),年化收入3000万美元;永信至诚当前总市值仅约38亿元,2024年数字风洞赛道营收1.75亿元人民币,2025年前三季度AI相关业务收入超1,700万元,按照以往永信至诚60%的收入都在四季度结算的季节性分布特征,预计永信至诚光是AI测评的业务估值对标LMArena就有约20亿人民币,这还是一级市场的估值,以A股目前对于AI产业的认可程度来看的话,换算到二级市场估值起码50亿起步,更遑论永信至诚AI数字健康管理、网络靶场和数字风洞其他收入的估值,加总起来毛估估起码80亿起步,这么一算永信至诚未来的投资回报还是很客观的。