当地时间8月7日,人工智能巨头OpenAI正式推出新一代旗舰大模型GPT-5,包含GPT-5、GPT-5 mini和GPT-5 nano等版本。新版本较之前性能有提升,但距离外界期待的“惊艳”,可能有不小距离。

GPT-5生成的关键指标对比
幻觉率下降
OpenAI曾内部预计GPT-5会在2024年底发布,但该计划并未实现;技术困难与质量目标未达预期成为延迟的主因。后来, OpenAI 明确表示,“2024年内不会发布任何名为GPT-5的产品” 。
进入2025年,市场普遍预期GPT-5将在夏季推出。但因技术问题、意外激增的需求,以及基础设施压力等,GPT-5最终推迟至8月才正式发布。
OpenAI首席执行官山姆·奥特曼(Sam Altman)发布会上宣称,GPT-5已实现"从大学生到博士级专家"的跨越,具备行业领先的编码、数学及医疗健康推理能力。
据悉,GPT-5在多项关键指标上取得显著突破。
GPT-5幻觉率降至前代模型o3的六分之一,编程能力在SWE-bench测试中较o3提升5.8个百分点至74.9%,在MMMU(学院水平视觉问题)和VideoMMMU(基于视频的多模态推理)中以得分84.2%和84.6%超过o3。
其API(应用程序接口)定价相比前代大幅降低。GPT-5输入和输出token单价分别为每百万1.25美元和10美元;mini版分别为0.25美元和2美元;nano版分别为0.05美元和0.4美元。而此前GPT-4o的输入token价格为每百万2.5美元。
OpenAI的野望
与此同时,GPT-5发布之前,OpenAI内部正上演"人才保卫战"。
据知情人士透露,约1000名技术研究和工程团队员工将获得数十万至数百万美元不等的留任奖金,分两年以现金或股权形式发放。此举直指Meta(META)等竞争对手的挖角行动——6月底,2024年年底才成立的OpenAI苏黎世团队核心成员Lucas Beyer等多人转投Meta。
GPT-5发布不久,特斯拉(TSLA)CEO埃隆·马斯克(Elon Musk)旗下xAI公司发起公开挑战,称Grok 4在ARC-AGI等基准测试中超越GPT-5。
此前在当地时间8月5日,谷歌(GOOG)举办的Kaggle国际象棋AI大赛中,结果显示,Grok 4以4:0碾压Gemini 2.5 Flash等一众模型,成为当前第一。而参赛的DeepSeek-R1和Kimi K2分别惜败于OpenAI o4-mini和o3。
OpenAI日前披露数据称,目前每周全球有7亿人在使用ChatGPT,2025年预计营收达127亿美元,明年将增长一倍以上至294亿美元。8月初,OpenAI还获得软银领投的400亿美元的融资,公司估值突破3000亿美元。其后,OpenAI还就一项可能的员工股票二次出售事宜进行谈判,公司估值有望达到5000亿美元。
奥特曼在发布会后发文表示:“我们完全有能力发布更强大的模型(未来也必将发布),但GPT-5的特殊价值在于——全球超过十亿人将因此受益”。