12月9日,智谱微信公众号宣布,开源其核心AI Agent模型AutoGLM。
AutoGLM以让AI真正学会“使用手机”为目标,让AI从说到做,可以帮助用户在外卖App里完成从选择到下单;在云手机里批量处理通知、点赞评论;在销售、客服、出勤等场景里,自动完成重复动作等操作。
智谱表示,AutoGLM于2024年10月25日发布,被业界视为首个具备“Phone Use”(手机操作)能力的AI Agent。
2025年,智谱推出了AutoGLM 2.0,验证了强化学习的规模扩展定律,提出MobileRL、ComputerRL和AgentRL算法,通过让AutoGLM在上千个虚拟设备环境里同时强化学习,扩展了Agent的准确性和泛化能力。
AutoGLM开源页面上显示,AutoGLM Phone Agent支持微信、微博、淘宝、京东、美团、抖音、小红书等超50款主流中文应用,可以完成启动应用、输入文本、长按、双击等操作,在面对登录、输入验证码等敏感操作时也会发起人工接管请求。
智谱为国内头部AI大模型公司,由清华大学团队孵化,致力于打造新一代认知智能大模型。此前,公司推出对话模型ChatGLM,开源单卡版模型ChatGLM-6B,还打造了AIGC模型及产品矩阵,包括AI提效助手智谱清言(chatglm.cn)、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。
近期,人工智能技术已向更具有实用价值的智能体Agent方向发展。行业希望AI能“长出手脚”,不仅在聊天框中和用户交流,提供思路和建议,还能进一步将建议转为行动。
但在实践中,用户个人隐私保护和网络安全隐忧仍在。以手机智能体为例,将App操作托管给AI需要用户授权屏幕读取权限,引发对个人信息泄露和Agent被灰黑产利用的担忧。
12月1日,豆包宣布发布技术预览版豆包手机助手,联合中兴通讯推出的工程样机nubia M153少量发售。根据演示,该手机中,AI助手实现了手机跨App调用,消息引起市场广泛关注,中兴通讯股价当日涨停。
但很快就有用户发现,在nubia M153上使用豆包手机助手操作手机功能时,会在部分App出现异常退出甚至无法登录的情况。业内人士认为,异常情况的出现可能与豆包手机助手需要使用系统级权限相关。
豆包也在后续声明中提到,确实需要用户主动授权INJECT_EVENTS系统级权限(或与其类似的无障碍权限),才能提供操作手机的服务。
在隐私方面,豆包表示,虽然手机助手确实需要读取屏幕以完成指令,但不会在云端存储任何用户屏幕内容,且所有的相关内容也都不会进入模型训练,确保用户隐私安全。
正因为隐私保护争议和当前手机难以支撑AI Agent模型算力需求的现实情况,智谱AutoGLM选择不完全部署于手机端,而是在云端运行端侧模型。智谱表示,这让AI Agent的每一个动作都可以回放、审计、干预,从而将敏感数据隔离。
行业人士认为,目前Agent技术仍在探索中,如何平衡使用体验和隐私安全等,仍需要行业共同努力,开源等方式或有助于加速行业对技术的共同研发。