当地时间周四,OpenAI推出了迄今最先进的大型语言模型GPT-5,这一成果历经两年多研发、多次推迟后终于面世。首席执行官山姆·奥尔特曼在发布会上形容,与GPT-5对话“就像在与某个领域的博士级专家交流”。这一版本首次采用集成模型架构,将根据任务自动选择推理深度,无需用户切换模式,并将在未来一周内分批向包括免费用户在内的所有ChatGPT用户开放。
奥尔特曼透露,GPT-5在速度、直觉与推理能力上全面提升,并能凭借“氛围编程”(vibe coding)让用户用自然语言生成可运行的软件应用程序。“它能做的最酷的事情之一,就是为你按需编写高质量的软件,这种即时开发的能力,可能会成为GPT-5时代的决定性特征。”他说。
“氛围编程”
与上一代相比,GPT-5最大的结构性变化是采用集成模型。这意味着系统将自主判断问题的复杂度,必要时调用更多计算资源进行“深度思考”。奥尔特曼称,这是普通用户首次接触OpenAI的“测试时间计算”技术,即在面对数学推导或复杂推理时,模型会主动延长计算时间以提高准确性。
在现场演示中,GPT-5根据简单文本提示生成了完整的可运行软件,从界面设计到逻辑功能均由AI独立完成。奥尔特曼还宣布,下一阶段将显著提升语音模式的自然度与智能化水平,让语音交互更贴近真实对话。
此次发布最大的商业信号,是OpenAI将GPT-5免费提供给大部分用户,包括免费版、Plus版、Pro版和团队版,企业与教育用户也将在下周获得接入权限。这一策略被认为意在迅速扩大使用规模,并推动AI应用的二次创新。
OpenAI特别强调了GPT-5在企业级场景的实力——不仅能进行软件开发,还可在写作、健康咨询和金融分析等专业任务中表现出接近专家的水平。奥尔特曼称,这款模型“第一次让我们的主线产品具备了可以向一位真正的博士专家提问的体验”。
发布会之际,OpenAI正进行一轮股权出售和内部股权转让谈判,对公司的估值约为5000亿美元,较此前3000亿美元的估值大幅跃升。
现实瓶颈
GPT-5的问世,正值全球科技巨头在AI基础设施上竞相加码。Alphabet、Meta、亚马逊以及OpenAI背后的微软,今年在AI数据中心上的资本支出预计接近4000亿美元。投资者希望这笔巨额投入能带来可观回报,但现实挑战依旧存在。
经济学作家诺亚·史密斯表示,当前消费者在AI上的支出热情高于企业端,“人们喜欢与ChatGPT聊天,但这还不足以证明庞大的数据中心投入物有所值”。对于OpenAI而言,如何将消费者热度转化为企业级营收,将是未来盈利能力的关键。
技术上,OpenAI在训练GPT-5的过程中遭遇了数据与算力瓶颈。一方面,大型语言模型依赖的高质量人类文本数据已接近极限;另一方面,模型规模越大,训练周期越长、硬件故障风险越高,团队可能需数月后才能评估一次训练的最终效果。前首席科学家伊利亚·苏茨克弗就曾提到,算力虽在持续增长,但数据供给的速度远远跟不上。
即便如此,奥尔特曼依然认为全球在AI基础设施上的投资“远远不足”,并强调OpenAI的使命是“构建造福全人类的人工智能”。在他看来,GPT-5并非终点,而是迈向更强大、更通用AI的重要一步。