上海交通大学“AI for Science”(人工智能赋能科学)又有新突破——今日正式发布光学领域垂直大语言模型——Optics GPT(光学大模型),该模型如同一位“虚拟光学专家”,能够深度理解光学原理,为科研、设计与教学提供智能化支持,为我国光学等硬科技领域的自主研发与智能化升级提供了新的基础设施与创新工具。
当前,通用人工智能模型虽功能强大,却难以深入理解如光学等需要深厚专业知识与精密计算的硬科技领域。上海交通大学“光生未来”项目组研发打造出这款“光学原生”专业模型,它系统学习了光通信、光学设计等领域的核心知识与设计逻辑,可谓从光学专业数据中“成长”而来。

上海交通大学教授义理林介绍,作为完全自研的国产模型,光学大模型具备轻部署、 高认知、强应用、全可控的特点。模型规模为 8B 参数量级,支持端侧与边缘高效部署,显著降低光学行业应用门槛;通过系统化、结构化注入光学领域知识,形成深厚的“光学素养”和精准的物理直觉;在算法生成、系统诊断、仿真设计、实验辅助等核心场景中性能全面领先;从数据构建、模型训练到部署运行全流程自主可控,保障产业安全与数据隐私。

为了客观评估 Optics GPT 在光学专业能力上的实际水平,团队构建了涵盖光物理、光量子、光学设计、非线性光学、光计算与光通信六大方向的光领域专业评测集,并将 Optics GPT 与多款主流通用大模型和开源大模型进行了系统对比测试。评测结果显示,Optics GPT 在所有核心维度上均取得领先成绩,充分验证了其在光学垂直领域中的专业深度与工程认知能力。这标志着一条全新的技术路径已经被验证:通过专业化、结构化训练,小模型同样可以在垂直领域超越巨型通用模型。

应用角度,该模型作为新一代智能教学工具,模型能够将抽象的光学理论与复杂公式转化为直观的可视化演示与互动问答,并可自动生成丰富的教学案例与虚拟实验,变革传统教学模式,显著提升教学效率与学习体验;在基础研究与前沿探索中,可作为全天候的智能研究助手,帮助科研人员快速梳理文献、启发创新构想、完成复杂模拟计算,辅助设计实验方案,加速从理论到验证的科研进程。
此外,从工业设计应用方面,该模型将深度赋能光学产业链的关键环节。例如,在国产高端仪器领域,可提升仪器使用体验,大幅增加高端仪器的智能化水平;在算力基础设施领域,为数据中心光互连系统的故障智能诊断与运维提供决策支持,并对光模块进行快速、精准的出厂标定;在激光制造领域,推动激光器等核心器件向参数自主优化、状态智能预测、故障自动运维的智能化方向升级。