• 最近访问:
发表于 2025-12-28 21:41:00 股吧网页版
2025金融大模型评测体系在沪发布
来源:经济参考网

  近日,在上海徐汇区“模速空间”举办的“2025金融大模型评测体系发布会”上,上海人工智能实验室和库帕思联合发布新版金融大模型评测体系和基准。评测发现,在测试难度提升的前提下,2025年大模型测试结果全面超越2024年。

  据悉,该体系在标准引领、数据驱动、安全可信与生态共建四大维度实现全面升级,构建覆盖金融全场景的评测基线,为行业提供统一、权威、可操作的技术评估框架。

  库帕思COO施佳樑介绍,该评测体系汇聚了4个公开数据集与22个自建数据集,约3.6万条评测数据,坚持科学与鲁棒的评测过程,采用循环选项打乱机制和多样化提示词,并研发金融裁判大模型,实现评测全流程自动化、标准化,助力机构选型、优化及风险把控。

  与会专家向记者解释,采用循环选项打乱机制,目的是避免大模型猜题或者固定答案;设置多样化提示词,是针对同一个考点设计不同文本提问以反复评测准确性;让大模型来评测大模型,是为了减少人工在评测过程中的干扰和不稳定性。

  此外,该评测体系包括大语言模型评测体系和智能体评测体系两部分。其中,智能体是2025年新增的评测对象。

  对此,上海财经大学教授张立文表示,金融智能体评测近期备受关注,也是实际评测中的难点领域。因为在金融实务中,大模型能力只是一方面影响因素,金融机构更多是以智能体的形式来提供服务。因此评测金融智能体更有实际意义。

  对于推出金融大模型评测体系和基准的必要性,上海市人工智能行业协会相关负责人表示,“人工智能技术正加速向金融行业纵深渗透,大模型在智能投研、风险控制、客户服务、合规审查等场景中的应用日益广泛。然而,面对模型能力参差不齐、评测标准不统一、安全合规边界模糊等现实挑战,行业亟需一套权威、开放、可复现、面向实战的金融 AI评测体系,以引导技术健康发展、加速产业落地进程。”

  上海市委金融办副主任、一级巡视员葛平表示,2024年由库帕思、上海人工智能实验室等机构发布的全国首个“以金融业务为中心”的金融大模型评测体系,为行业提供了科学选型与能力对标的重要“标尺”。2025年评测体系的全面升级,将助力上海建设具有全球影响力的金融科技中心。

  会上,上海市委金融办金融科技处、徐汇区商务委、上海市经信委人工智能处、上海市委网信办网络技术处,联合上海人工智能实验室、库帕思及上海财经大学,共同发布《金融大模型应用评测报告(2025)》与《金融大模型评测数据集(2025)》。该报告基于真实金融业务场景构建评测任务,探索金融垂直领域大模型应用的新理念、新机制与新手段,将有效支撑金融机构科学选型、降本增效,加速大模型在投研、风控、客服等核心环节的规模化落地。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500