美国开放人工智能研究中心(OpenAI)12月11日发布其人工智能模型GPT的最新升级版本GPT-5.2,以应对生成式人工智能领域日趋激烈的竞争。

图片来源:OpenAI官网
为回应谷歌公司11月所发布人工智能模型双子座3的出色表现,OepnAI首席执行官萨姆·奥尔特曼近日启动“红色警报”,加快GPT升级版本的发布速度。
OpenAI今年8月推出GPT-5后,11月即发布升级版本GPT-5.1,眼下不到一个月就再次更新。业界认为,此举凸显人工智能行业目前面临的竞争压力。
GPT-5.2是OpenAI迄今最先进的人工智能(AI)模型,针对专业工作场景进行了全面优化,创多个基准测试的行业记录,其中的GPT-5.2 Thinking刷新了SWE编码能力测试的历史最高分,也是OpenAI首个性能达到或超过人类专家水平的模型。
OpenAI介绍称,GPT5.2是迄今为止在“专业知识工作方面”表现最好的模型系列,在制作电子表格、制作演示文稿、图像感知、编写代码以及理解长上下文等方面都优于前代产品,旨在"为人们创造更多经济价值"。OpenAI的研究副总Adain Clark称,GPT-5.2在数学推理方面的进步意味着它能更好地处理金融建模、预测和数据分析等任务。
OpenAI宣布,12月11日当天GPT5.2就在ChatGPT上线,面向Plus、Pro、Go、Business和 Enterprise这些付费套餐的用户, 共推出Instant、Thinking和Pro三个版本,API也同步开放给所有开发者。
在ChatGPT中,付费用户可使用三个版本的GPT-5.2,且在未来三个月内仍可继续使用GPT-5.1。在API平台,GPT-5.2定价为每百万输入token 1.75美元、每百万输出token 14美元,缓存输入可享受90%折扣。虽然单token价格高于GPT-5.1,但OpenAI表示,由于模型效率更高,达到相同质量水平的总成本反而更低。
三个版本GPT-5.2分别主打快速、深度、智能可靠
OpenAI分别介绍称,Instant是快速高效的日常工作和学习助手,在信息查询、操作指南、技术写作和翻译方面均有显著提升,并延续了 GPT-5.1 Instant 中更亲切的对话风格。早期测试者尤其注意到,GPT-5.2 的解释更加清晰,能够直接呈现关键信息。
Thinking 专为深度工作而设计,能够帮助用户更高效地完成更复杂的任务,尤其是在编码、总结长篇文档、回答有关上传文件的问题、逐步进行数学和逻辑运算、以更清晰的框架和更有用的细节辅助规划和决策方面。
Pro是需要高质量回答难题时“最智能、最可靠”的选择。早期测试表明,它在编程等复杂领域表现更出色,且重大错误更少。
性能全面领先,多项基准测试创新高
GPT-5.2在多个关键基准测试中刷新了行业纪录。在GDPval测试中,该模型在涵盖44个职业的知识工作任务上,有70.9%的表现达到或超过行业专家水平。OpenAI称,GPT-5.2 Thinking完成这些任务的速度是专家的11倍以上,成本不到专家的1%。

在编码能力方面,GPT-5.2 Thinking在SWE-Bench Pro上取得55.6%的成绩,在SWE-bench Verified上更是达到80%的新高。这一基准测试真实世界软件工程任务,涵盖四种编程语言。OpenAI的产品负责人Max Schwarzer表示,GPT-5.2在代码生成和调试方面取得重大进步,Windsurf和CharlieCode等编码初创公司报告称该模型实现了"最先进的智能体编码性能"。

OpenAI声称GPT-5.2 Thinking是"世界上最好的视觉模型",在图表推理和软件界面理解方面的错误率降低了约一半。在长文本处理上,该模型在OpenAI MRCRv2测试中率先在25.6万token范围内实现近100%的准确率,使其特别适合深度文档分析和多源信息工作流。
在科学研究领域,GPT-5.2 Pro在GPQA Diamond测试中达到93.2%的准确率,GPT-5.2 Thinking紧随其后为92.4%。在专家级数学测试FrontierMath上,GPT-5.2 Thinking解决了40.3%的问题,创下新纪录。OpenAI称GPT-5.2 Pro和GPT-5.2 Thinking是"世界上最好的科学家助手模型"。
作为OpenAI对谷歌的反击,GPT5.2仅仅是打出的“第一拳”。
公司CEOAltman在12月11日宣布,下周会给用户们带来一些“小小的圣诞礼物”。他表示,Gemini 3对公司各项指标的影响比原本担心得要小。他还说,预计OpenAI将在2026年1月“以非常强劲的姿态”退出目前的红色警报状态。

OpenAI首席产品官Fidji Simo也在12月11日透露,现在已经开始在部分地区推出年龄估算系统,此举旨在控制ChatGPT对18岁以下用户回复的内容。Simo也表示,公司希望在明年一季度推出“成人模式”前先引入这一功能。
此前有报道称,OpenAI计划在明年1月再发布一款新模型,具有更好的图像能力和更完善的个性化特点,但公司周四未对这一传言予以确认。
每日经济新闻综合公开消息