8月8日凌晨,OpenAI发布其最新人工智能模型GPT-5。据悉,GPT-5系列涵盖GPT-5、GPT-5 mini及GPT-5 nano三款模型,上下文长度均达400K,最大输出为128K tokens。
OpenAI首席执行官萨姆·奥尔特曼称,GPT-5是“世界上最好的模型”,代表着OpenAI在开发通用人工智能(AGI)道路上迈出了“重要一步”。
事实错误率降低
据了解,GPT-5融合了大语言模型GPT系列和推理模型o系列,用户使用时无需再手动切换不同模型。在能力提升方面,GPT-5在数学、编程、视觉感知和健康等领域大幅度超越前代,成为OpenAI目前最强大的模型。
此外,GPT-5的幻觉大幅降低,与GPT-4o相比,GPT-5的事实错误率降低了45%;深度思考模式下,事实错误率比o3降低80%。
OpenAI方面表示,GPT-5是迄今为止最强大的编码模型,在复杂的前端生成和大型代码库调试方面表现尤为突出。GPT-5通常只需一次提示就能创建网站、应用程序和游戏,并兼具美感。
值得关注的是,GPT-5 API价格持续下降,每百万token输入1.25美元,输出10美元。其价格不仅低于GPT4o,也仅为Claude Opus 4.1的1/15,甚至比以“低价”著称的Gemini 2.5 Pro(谷歌旗下产品)更实惠。
多家券商发布研报称,GPT-5等模型及智能体能力的持续提升,将继续推动AI应用商业化加速。而GPT-5的编程能力被视为有望引领下一代AI落地的核心应用。
不过,有不愿具名的行业分析师对《证券日报》记者表示,GPT-5并未带来“眼前一亮”的惊喜,其根源在于Scaling Laws(尺度定律)的“拉力”正在减弱:当参数、算力和数据量继续膨胀时,性能曲线反而趋于平缓。
国产大模型加速进化
随着多模态理解、智能体技术及推理引擎的突破,国产大模型从辅助工具跃升为核心生产力,深度渗透政务、金融、制造、医疗等实体经济领域。
今年以来,国内大模型厂商持续推陈出新。7月30日,北京火山引擎科技有限公司发布豆包图像编辑模型3.0、豆包同声传译模型2.0,豆包大模型1.6系列全新升级,并宣布开源扣子核心能力,发布企业自有模型托管方案、Responses API等多个模型服务和工具产品。8月7日,阿里通义千问推出更小尺寸新模型Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。
此外,多家厂商持续开源。6月30日,百度集团股份有限公司(以下简称“百度”)正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型以及0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源;8月5日,阿里开源全新的文生图模型Qwen-Image,当天即登顶全球最大的AI开源社区Hugging Face(抱抱脸美国人工智能公司)的模型榜单,成为全球热度最高的开源模型。
整体来看,国内大模型正加速商业化落地。据智能超参数统计,2025年上半年大模型累计中标项目达1810个,总金额突破64亿元,中标项目数量已超过2024年全年的1521个,中标金额也接近去年全年的64.69亿元水平。
事实上,目前国内大模型的竞争格局已逐渐明朗。以百度为首的头部厂商正加速分割市场份额。从中标信息来看,百度智能云以48个中标项目和5.1亿元中标金额稳居项目数量与金额“双第一”,并在金融、能源、政务、制造等重点行业持续领跑。科大讯飞和火山引擎则以3.7亿元和3.6亿元位列第二名和第三名,阿里云、智谱、腾讯云位居第四名至第六名。
广州艾媒数聚信息咨询股份有限公司CEO张毅对《证券日报》记者表示,国产大模型正由“参数竞赛”迈向“场景深耕”:算力券、开源潮叠加央国企大单,头部互联网企业的多模态与智能体在电力、制造、零售等领域快速落地;随着推理成本再降一个量级,2025年底将形成“云—边—端”闭环。