本报讯 (记者矫月)近日,国家数据局正式发布2025年高质量数据集建设先行先试入围名单。由中国证券监督管理委员会推荐,恒生电子联合浙商证券股份有限公司、子公司上海恒生聚源数据服务有限公司(以下简称“恒生聚源”)共同申报的“面向金融行业大模型的多模态高质量数据集建设”项目成功入选。
为落实“人工智能+”行动有关部署,加快推动高质量数据集建设,国家数据局围绕试技术、试支撑、试标准、试机制4项重点任务,组织开展高质量数据集建设先行先试工作,旨在建设一批产业亟需、规模庞大、模态丰富、质量过硬、富有行业特色的行业高质量数据集,赋能人工智能纵深发展。
此次入选的“面向金融行业大模型的多模态高质量数据集建设”项目,聚焦金融垂类大模型在“数据质量参差、可解释性不足、场景落地困难”等方面的核心难题,构建“数据融合—标准化处理—知识建模—场景应用—生态赋能”的建设路径。深度融合新闻、财报、研报、公告、会议等多模态信息,全面覆盖股票、债券、基金等全品类金融数据,以及宏观经济与行业研究指标,通过系统化的数据清洗、标准化处理与结构化建模,构建起高准确性、高时效性、高覆盖的金融高质量数据集。后续,该数据集还将落地数据服务平台,可广泛应用于智能投研、智能投顾、风控合规等场景,有力推动金融大模型在真实业务场景中落地,助力金融行业智能化升级迈上新台阶。
恒生电子在金融行业大模型研发与应用、数据基础设施建设等方面具有深厚的行业积累。公司深耕资本市场信息化建设三十余年,为证券、基金、信托、银行、交易所等金融机构提供行业一流的技术与产品服务。
2023年起,恒生电子积极开展大模型技术的研发与应用,成功发布了金融大模型中间件平台“光子”以及面向投顾、投研、运营、合规、投行等金融业务场景的大模型系列应用,并已与多家金融机构开展大模型项目共建,助力大模型技术在金融业务中的融合应用。此外,公司还积极参与大模型行业生态建设,联合信通院发布金融行业大模型标准,并与阿里云、华为等展开合作。
恒生聚源作为专业金融数据服务商,在金融数据的收集、清洗、结构化处理、运营管理以及深度挖掘等方面具有丰富的行业建设经验,已为近千家机构提供金融数据服务。基于自身深厚的数据和AI技术储备,恒生聚源积极探索金融行业大模型建设落地,是国内前瞻性布局大模型的金融数据企业之一。
目前,恒生聚源已推出面向大模型深度优化的“AI友好型金融数据库AIDB”,旨在为大模型在金融业务场景下的应用提供高可靠性、高精准的底层数据。本次项目中,恒生聚源也将充分发挥自身在数据治理、大模型与数据要素交互应用等方面的实践经验,深度参与行业高质量数据集的构建以及链接数据库的联合研发,并参与建设数据运营管理平台。
未来,恒生电子和恒生聚源将以本次试点为契机,在国家数据局和证监会的指导下,全面践行“人工智能+”行动,持续聚焦金融行业高质量数据集建设,为大模型技术在金融业务场景中的融合应用创新打造坚实数据底座,为金融行业的数智化转型升级和高质量发展注入源源不断的数据力量。