• 最近访问:
发表于 2025-05-15 10:06:50 股吧网页版
解决百年数学难题 谷歌智能体展示强大编程能力 Agent最适配场景呼之欲出?
来源:科创板日报

  《科创板日报》5月15日讯今日凌晨,谷歌Deepmind在官网发布了AI Agent工具AlphaEvolve,基于Gemini 2.0大语言模型,自动化算法发现过程,解决传统算法设计和科学发现中依赖专家直觉和手动迭代的局限性。

  值得一提的是,这款智能体是被专门用于设计高级算法的编程AI Agent,其能够衡量大模型生成想法与算法的可行性并加以筛选。在性能测试下,AlphaEvolve将大规模矩阵乘法运算拆解为更易于处理的子问题,使Gemini模型架构中的核心计算效率提升了23%,节省了大量成本。

  为展示AlphaEvolve的能力,谷歌试图令其解决数学难题——亲吻数问题。这道题的历史最早可以追溯到1694年,牛顿还和别人辩论、研究过。其难点在于给定维度的空间中,最多可以有多少个相同大小的球体同时接触一个中心球体,这些球体之间不发生重叠。

  结果是,AlphaEvolve发现了由593个外层球体组成的结构型,并在11维空间中建立了新的下界,超越了之前数学家们创造的纪录。

  事实上,近期各个科技巨头在AI编程等软件开发领域的商业化动作频频。同样在今日凌晨,OpenAI宣布,应广大用户的要求,专攻编码任务和指令遵循的专用模型GPT-4.1即日起将直接在ChatGPT中提供。

  据介绍,在基准测试中,GPT 4.1在编程能力方面获得54.6%的成绩,较GPT 4o提高了21.4个百分点,较GPT 4.5提高了26.6个百分点,成为当前领先的编程模型之一。与此同时,GPT-4.1在小模型和驱动智能体方面表现突出,可广泛应用于真实世界的软件工程、大规模文档洞察提取等复杂任务,且无需过多人工干预。

  国内方面,阿里云通义灵码AI程序员已全面上线,开发效率提升数十倍,已在哈啰集团、长安汽车等公司被应用。腾讯云AI代码助手已接入DeepSeek-R1,代码生成准确率提升30%。

  有券商指出,2025年将是AI Agent元年,也是软件大革命的起点。编程领域的规则明确性为Agent应用提供了天然约束框架,编程环境的技术特性为Agent自纠错提供了理想试验场,同时编程原子化任务与大模型链式推理机制深度契合。

  西部证券表示,AI大模型在编程中的应用发展分为三个阶段,目前各大厂商产品多处于第一阶段向第二阶段迈进的关键节点:

  大模型作为Copilot,辅助程序员完成任务,但并不改变软件工程的专业分工。

  Agent能够自主完成一部分任务,成为一个单一职能专家,能够自主使用工具完成预定的任务。人在这个阶段的作用是给定上下文完成知识对齐。

  多智能体互相协作完成复杂任务,人类则负责创意、纠偏和确认的工作。

  从投资层面来看,该机构认为,国内软件目前估值水平普遍较低,存在显著修复空间。类似“云化”,当前国内软件公司的估值修复可基于“AI化”程度,AI化程度越高即AI收入越高时,估值越高。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500