2025年末,一款豆包手机助手的面市,在手机圈掀起巨大波澜。
因其具备自主跨应用操作能力,而不仅仅是对手机内生系统应用发起指令,而被众多用户称为搭载该助手的是“一款真正意义上的AI手机”。
但很快,豆包手机助手在多个应用中的使用受阻。12月5日,“豆包手机助手”账号发布《调整AI操作手机能力的说明》。

这倒像是按下一个开关。随后,12月9日,智谱官宣将一年前已经发布的闭源AI Agent模型AutoGLM全面开源;12月17日,阶跃星辰宣布GUI Agent全面升级,最短部署十分钟可拥有“AI手机”。
虽然基于这些开源模型,普通消费者自己“手搓”一个AI手机还存在技术门槛,但这显示出大模型厂商的开放态度。
多名行业人士对21世纪经济报道记者分析,豆包手机助手所面临的,本质上是AI手机普遍面临的挑战。虽然底层技术在逐渐完善,但更核心的分歧在于权责划分,也即国内在用户隐私和数据权限边界方面存在标准空白,亟待手机、大模型、软件等多方参与者共同推进。
这也揭开了AI手机技术演进的另一面。
当然,随着国内开源大模型性能迅速提升,AI手机的迭代发展有了更为坚实的土壤。从此前厂商普遍强调云端模型跑分,到今年端侧模型席卷,离线的AI手机也开始聪明了。
2025年的AI手机竞赛显露出,这个可能改变既有行业格局的新硬件,不止步于对技术临界点的持续冲击,更是一场关乎耐心、克制甚至充满博弈的“生态合唱”。
“先驱”豆包?
豆包手机助手之所以备受关注,源于其真正把一个会“自主”运行的AI手机带到大众眼前。但实际上,21世纪经济报道记者综合观察发现,豆包手机所展示的功能,本质上与国内手机厂商此前公开演示过的智能体应用案例并无明显差别。
在2024年,就陆续有手机厂商在发布会上展示过,用一句话让手机自主帮助用户点咖啡送达现场等功能。但至今,部分被展示的跨应用自主运行能力,并未真正落地在商用手机中。
而豆包方面也强调,搭载豆包手机助手技术预览版的工程样机nubia M153少量发售。豆包没有开发手机的计划,且正在和多家手机厂商推进手机助手的合作落地计划。
“基于模拟操作的AI Agent本身就更容易引发App的风控,这点在其他手机厂商的AI Agent功能上也发生过,只是豆包手机助手受到的关注更大。因为这是互联网厂商首次入局AI手机领域,也自然会受到同行竞争对手更密切的关注。”Omdia分析师钟晓磊对记者分析道。
这一方面意味着AI手机的技术逐渐完善,已经在探索落地应用;但另一方面也显露出从技术到商业化仍有未解命题。
有业内人士对记者分析,其核心瓶颈在于遭遇了法务层面的挑战争议在于,这种跨应用自动化操作,是否会损害互联网厂商利益,以及授权模式是否符合合规要求。
简单来说,过去行业通行的“单次操作、单次确权”模式,在AI时代已难以适配需求。用户希望AI能一键完成跨应用任务(如多电商平台比价),但现有合规标准仅支持“一个应用一个界面一个操作确权”,缺乏身份授权、场景授权的明确依据,导致这类实用功能陷入“标准真空地带”。
“手机智能体做任务时,调用系统内的功能,比如连接WiFi、调节屏幕亮度都没有问题,但涉及多平台、尤其敏感数据的时候,就需要共同推进行业标准建立。”该业内人士举例道,这需要手机与互联网等多方厂商共同达成共识,逐步探索。
vivo副总裁、OS产品副总裁周围此前受访时也谈到进入智能体时代,手机厂商的边界命题。他指出,考虑到分发是智能体时代的敏感问题,因此vivo会聚焦于智能体对手机本身的功能和系统调度能力;至于智能体商店这类框架,则需要平台厂商推进;涉及跨智能体间的通信需要产业链共建。
在他看来,手机厂商当前可以积极展示已经达成的例如UI Agent等能力,而这些会随着大模型技术日益完善而愈发成熟。当前互联网公司会担心界限命题,但随着逐渐厘清,自然未来彼此间会一拍即合。“我们觉得可以留给时间来解答。”周围续称。
面对这一现象,Omdia高级首席分析师詹墨磊对21世纪经济报道记者指出,豆包AI手机面临的困境极具普适性,本质是AI Agent试图接管用户入口与超级App捍卫流量主权之间的商业博弈,这是所有手机厂商推动AI落地时必须面对的“入口争夺战”。
从这个角度看,大模型紧随其后推进手机Agent开源,试图让更多人接触AI手机的本质,进一步显露出产业层面的探索意愿。

詹墨磊对记者指出,智谱开源AutoGLM标志着手机Agent迎来了“技术平权”时刻。其采用的视觉方案有效绕过了操作系统底层权限与App接口封闭的壁垒,极大降低了开发门槛,有望引发端侧AI应用的爆发。这意味着当下推进手机Agent的技术条件已相对成熟,基于视觉的GUI操作路径可行。尽管大规模商用仍面临隐私安全与App反制等生态挑战,但开源举措打破了技术垄断,标志着“AI操作手机”已从概念验证正式迈入工程化落地的黄金窗口期。
争夺端侧
推进智能体技术落地的另一面,是随着国内领先开源大模型的持续创新,为AI手机夯实技术底座提供土壤。
相比于2024年前后强调云端模型的综合跑分,今年手机厂商普遍转向强调端侧(离线)大模型的能力外拓。也即,除了在大算力场景要调用云端资源外,AI手机在离线状态下能完成越来越多任务。
周围对21世纪经济报道记者坦言,这要感谢DeepSeek这两年让AI推理能力极大提升。
据他分析,此前vivo专注发力涵盖不同参数规模的模型,尤其在1750亿参数规模之后,再投入研发能力就发现对算力基础设施提出极高要求。
“我们很快发现万卡集群不够用了,要做两万卡以上集群,仅设备就需要追加20多亿元投资,还可能远远不够,因此,我们觉得执着于通用人工智能不太现实。”周围续称,而DeepSeek的出现,迅速拉齐了众多千亿参数规模大模型的能力,且可以让手机厂商满血部署。
周围分析道,在2024年,vivo尝试将70亿规模模型在端侧实现能力落地,但发现效果不太理想,对内存也有较大占用,但今年随着模型能力大幅提升,今年的700亿参数模型能力已经强于去年1750亿参数模型,今年30亿参数模型已经强于去年100亿参数模型,可以对端侧的复杂任务进行拆解。
OPPO ColorOS智能助理部总经理万玉龙也对21世纪经济报道记者指出,国产开源模型厂商在生态中开源了诸多小型化模型,让手机厂商可以基于自身定位开展小型化模型定制工作,亦或是进行模型量化裁剪。在此基础上,再借力与芯片厂商合作,进行模型结构适配和加速工作,可以更好确保端侧模型部署过程中性能和功耗达到平衡。
“我们认为,原本以云端模型推理为主,到现在可以让云端和端侧算力做结合的计算范式,让终端厂商有了关键机会点。”他续称。
而端侧模型越小,就越容易在手机上部署。周围举例道,去年vivo推出的70亿参数模型需要3.5G内存,对于高端机型8G起步的内存来说,意味着很大性能掣肘;但今年30亿参数端侧模型仅需2G内存,已经不再影响高端手机的使用。
在今年的开发者大会期间,vivo推出的30亿参数端侧多模态推理大模型,已经可以实现离线通话录音总结、写作等功能。在意图识别和任务拆解等方面,能力实现了大幅提升。
Omdia首席分析师李泽刚对21世纪经济报道记者分析,手机厂做云侧模型很难和第三方云端大模型公司竞争,因为对前者来说,云侧模型投入太大,短期难以达到盈利预期,而第三方云端开源大模型会让厂家自建云端大模型的差异化减少。
“厂家转向端侧,是在想以AI Agent的模式发展,通过模型优化,提升模型的推理逻辑能力,辅助用户在系统内更便利地使用手机服务。”他续称,最重要的是,手机厂家只有在端侧模型上,才能实现产品体验上的差异化。
生态探路
AI手机的终极竞争,本质上是生态的竞争。豆包手机助手的出现推动行业意识到,AI手机的成熟不仅需要技术突破,更需要构建开放协同的生态体系,但当前生态建设仍处于早期探索阶段,同时还面临存储涨价等外部因素带来的现实阻碍。
万玉龙对21世纪经济报道记者坦言,Agent(智能体)普及仍面临三大挑战:生态开放与协议统一、跨应用调度权限的获取以及用户习惯培养。
具体来说,多智能体间的连接需要手机厂商与第三方服务商联动数据与权限,因此在技术方面,国内外均在推进相关协议规范的构建,典型如谷歌主导的A2A方案,核心就是解决互联互通标准问题。
此外,当前多数用户仍习惯于通过GUI方式操作手机,也即依托屏幕触控等方式实现,而智能体模式需要用户适应“AI代劳”的交互逻辑。
更重要是市场对生态开放的态度。业界目前的普遍观点是,Agent调用服务模式与传统APP模式会有一定冲突,前者要求系统级AI具备跨应用调度能力,但目前阶段,部分第三方服务厂商对开放权限持谨慎态度,会导致生态协同效率受限。
在技术层面,AI手机的落地也对供应链提出新的要求。
“随着端侧模型能力扩大,核心壁垒已从单纯的算力不足转向了‘内存墙’与‘功耗墙’。”詹墨磊对记者分析,目前LPDDR内存带宽难以支撑大模型高速推理的吞吐需求,而高负载带来的发热与能耗也严重挑战电池技术,因此提升内存带宽和突破能效比是当前硬件供应链的攻坚核心。
其实放眼如今的AI硬件市场不难发现,传统定义下的软件和硬件公司,其边界也正走向模糊。
除了豆包依托字节跳动此前对锤子手机的收购,在夯实手机助手方面的能力;阿里巴巴旗下夸克和百度旗下小度都在今年推出AI眼镜品类。
Omdia智联互通资深分析师巨其然对21世纪经济报道记者分析道,软件与硬件厂商之间的界限确实在逐渐模糊,其根本驱动力在于以LLM(大语言模型)为代表的AI软件厂商亟需新的应用载体。这已不再局限于传统的应用界面层面,而是让硬件成为AI入口的承载平台,能够为AI提供更丰富、更直接的数据采集。
这一趋势在海外同样有明显体现。例如,OpenAI正在探索AI硬件初步形态,Google重返智能眼镜领域。“端侧相较于云端而言,可直接收集多维度的感知数据,使得端侧AI在响应速度、实时性和隐私保护方面具备本质优势,这强化了软件厂商向硬件渗透的动力。”他进一步表示。
巨其然指出,基于LLM赋能的具备AI Agent功能的智能终端,有望成为未来竞争的核心载体。长期来看,这一趋势或将重塑传统消费电子产业的商业模式:从依赖一次性销售和售后维修的硬件盈利模式,转向以软件服务订阅和生态服务为主导的长期付费模式。
回望豆包掀起的这场波澜,其意义远不止于一款产品的探索。它是一次关于生态规则的压力测试,将产业协同中必须解决的权限、利益与标准问题暴露在大众眼前。
AI手机的竞赛,也从单纯的硬件参数或模型大小,演进为一场关于端侧能力、生态开放与用户体验的综合性长跑。
2025年手机圈的故事告诉我们,当鲶鱼敢于跃出水面,整个池塘都将重新计算流向。