深圳商报·读创客户端首席记者吴吉
近日,由香港中文大学(深圳)、上海交通大学、上海财经大学、杉数科技等联合研发的ORLM智能决策大模型相关成果被运筹学领域国际顶级期刊《运筹学》正式接收,这是该期刊创刊70余年来首次收录关于大语言模型的研究论文。

在此论文中,港中大(深圳)团队参与提出的ORLM模型展现出显著的工程应用价值:在决策问题的建模环节,该模型能够大幅提升工程师的工作效率,可以辅助工程师将决策问题中建模环节效率大大提升,同时较其他大模型提升10%-25%的准确率,这将显著提升工业场景中的人机协作效率。此次研究成果实现了开源大语言模型在自动化优化建模领域的重要突破,不仅填补了该方向的学术空白,更为企业决策优化提供了可落地的技术路径。
运筹学作为一门优化决策的科学,广泛应用于工业、物流、金融等领域。其中,优化建模与求解技术是运筹学实际应用的核心环节。然而,传统运筹优化方法长期面临两大挑战:高度依赖专家经验,存在建模周期长、泛化能力弱等瓶颈;现有基于闭源大模型(如GPT-4)的解决方案虽能提升效率,却面临数据隐私泄露、技术垄断等问题。

此研究中所提出的ORLM为解决这些行业痛点提供了创新方案。该研究首次提出了一种创新的、可定制化的开源大语言模型训练框架OR-INSTRUCT,专为优化建模任务设计。该框架支持对开源大模型进行领域定制训练,显著提升了模型在自动化建模与求解方面的能力,在制造、物流、电商与零售等多个行业测试中展现出卓越性能——决策效率提升:辅助工程师平均缩短2小时以上决策时间;决策质量优化:使决策准确率提升10%-25%;数据安全保障:通过本地化部署,解决企业数据隐私泄露风险的定制难题。
方法上,联合研究团队构建了从数据生产、模型训练到场景落地的完整技术闭环,主要包括三大技术创新。其一是研究团队设计了一种半自动化的数据生成方法——OR-Instruct,结合扩展策略(Expansion)与增强策略(Augmentation),有效缓解了高质量标注数据匮乏的问题,从600余条基础数据出发共合成30,000余条高质量训练样本;其二是团队构建了IndustryOR基准数据集,涵盖13个行业与5类典型问题(包括线性、整数、混合整数、非线性及其他),并设有多级难度划分。相比国际已有数据集,IndustryOR在多样性与现实性方面具有显著优势。其三是实验结果表明,开源模型系列“ORLMs”在多个公开基准数据集上的表现均显著优于如GPT-4等的主流闭源模型及其他开源大模型,达到了当前该领域的最先进水平。
港中大(深圳)科研团队在项目中发挥了重要作用,其中,计算机与信息工程博士生唐正阳为共同第一作者,负责框架设计和实验验证;数据科学学院王本友教授和王子卓教授为通讯作者。三位研究者在优化决策、大语言模型训练与数学推理方面各展所长,充分体现了港中大(深圳)在人工智能与运筹学交叉领域的研究实力,也再次展示了大学在前沿科技领域的创新能力和国际影响力。
数据科学学院是香港中文大学(深圳)人工智能的科研与教学基地,致力于为学校提供包括计算机科学、统计学、大数据科学等在内的人工智能基础教育。学院现有90余位来自世界各地的全职教授,汇聚了多位国际知名学者,超过35%的全职教授为院士、会士或全球顶尖科学家。这些学者在机器学习、自然语言处理、计算机视觉等前沿领域具有卓越的学术成就与科研贡献。作为学校在人工智能领域的重要支柱,数据科学学院不断推动技术创新与跨学科合作,为培养具备全球视野的人工智能人才提供了坚实的基础。
(图片由学校提供)