• 最近访问:
发表于 2025-05-29 12:15:50 股吧网页版
云从科技从容大模型登顶全球多模态榜单
来源:证券时报网 作者:李映泉


K图 688327_0

  国际权威评测平台OpenCompass最新公布全球多模态榜单,其中,由云从科技(688327)自主研发的从容大模型以80.7分的综合成绩登顶榜单。这一成绩不仅刷新了国内AI模型在国际多模态测评中的最高得分纪录,亦超越了谷歌、OpenAI等全球顶尖人工智能巨头,与商汤科技SenseNova(80.4分)、上海AI LAB InternVL(79.1分)等中国团队共同占据榜单前10名的半壁江山,展现了中国在通用人工智能领域的突破性进展。

  据介绍,此次评测中,云从科技从容大模型展现了全方位技术优势。面对涵盖视觉感知、认知理解与跨领域应用的八大核心数据集,该模型在医学健康、数理逻辑、艺术设计等十余个专业领域表现突出。尤其在MMBench中文测试、高难度学科综合评测(MMMU)及高阶推理榜单(MMStar)中均拔得头筹,并在复杂场景文本识别(ocrbench)、开放域问答(MMVet)等关键场景中稳居全球前列,其综合能力较国际头部模型GPT-4.1领先近5分。

  记者从云从科技获悉,该技术的突破缘于公司在多模态核心领域的持续深耕,从容大模型聚焦通用视觉语言理解与推理任务,通过三大核心领域(多模态对齐、高阶推理、长上下文建模)的突破性优化,构建起多项全球领先的技术壁垒。

  在“多模态对齐”方面,从容大模型自建面向强化指令对齐的高质量基准数据集,覆盖了图文问答、多模态理解、多轮交互等任务场景,提升多模态理解与任务指令遵循的推理表现。

  在“决策类人化”方面,从容大模型首创融合DPO(直接偏好优化)与GRPO(生成式奖励优化)的双重对齐技术,无需依赖奖励模型即可实现类人化推理决策,通过优化模型学习机制,从容大模型实现了更贴近人类思维的决策方式,在复杂问答与多轮交互中展现出更强的智能行为选择能力。

  此外,在高效工程优化上,从容大模型重点攻克了4K高分辨率图像问答场景,面向多模态文档理解(OCR)对模型的图像编码器进行了结构优化,可处理高分辨率图像与文档(如合同、发票表格等),支持多模态文档的智能审查、智能解析、智能问答等任务;面对跨页文档分析、多轮对话等长文本场景,可精准追踪超过3万字的上下文逻辑。

  在原生多模态推理上,从容大模型全面升级,面向多图、跨图场景的图文交错模式和原生视频模式,提供原生的多模态文档理解和多模态视频理解,可以实现跨图比较、图文组合推理、多图问答等复杂多模态任务,进而提升大模型的模型理解深度与广度。

  目前,从容大模型已在金融、制造、政务等多个领域通过AI智能体实现规模化落地。例如,某银行基于该模型与云从科技合作打造风控合规案防智能平台,构建风控AI智能体,实现风险识别自动化和问责标准化,投诉数量压降50%以上;在电商领域,云从科技为正浩创新部署的智能客服平台,通过多模态对齐与知识库精准匹配,将问答准确率提升至95%,客服月均效率提高24%。

  “技术创新最终要服务于社会价值。”云从科技联合创始人姚志强表示,团队将持续探索多模态技术的安全落地模式,以自主创新的AI基础设施,为全球智能化转型提供更高效、更包容的技术支撑。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500