12月1日,字节跳动豆包团队发布豆包手机助手技术预览版。这直接引爆了A股AI手机概念股。
截至收盘,天音控股、福蓉科技、道明光学封板,近两千亿元A股市值的中兴通讯也封在涨停。
12月1日,字节跳动豆包团队发布豆包手机助手技术预览版。豆包手机助手是在豆包App的基础上,和手机厂商在操作系统层面合作的AI(人工智能)助手软件。基于豆包大模型的能力和手机厂商的授权,现阶段可在豆包与中兴合作的工程样机nubia M153上体验这项版本。
豆包方面明确表示,这是一款需要和手机厂商一起完成的产品,目前正与多家手机厂商洽谈助手合作。
按照字节跳动方面表述,豆包大模型能力全面,模型在推理、视觉理解、图像创作、视频生成、语音等方面的性能达到国际一流水平,图形界面操作能力更是在多项权威评测中获得业界最佳成绩,可以像人类一样操作手机,完成各种复杂任务。
今早,已经有媒体测试了新品。
“对比一下京东、美团外卖、淘宝上的肯德基香辣鸡腿堡哪个更便宜,选价格最低的下单,送到三里屯SOHO A座的地址,下单的时候备注 ‘放前台’,下单后把订单截图微信上发给小明,告诉他外卖点完了。”整个过程,只有付款阶段需要人工介入,其他操作全部由 AI 在后台自动完成。
值得注意的是,在手机助手的落地路径上,豆包明确表示没有自研手机计划,而是与多家手机厂商洽谈,以“生态合作”形式将豆包手机助手整合进不同品牌机型中。业内认为,这有点类似于“华为不造车,而是赋能车企”的华为模式。
记者查询发现,目前开发者和科技爱好者已经可以在豆包与中兴合作的工程样机nubia M153上,体验豆包手机助手的技术预览版本。目前该版本已面向开发者和科技爱好者少量发售,售价3499元。
在豆包手机助手发布的技术预览版演示视频中可以看到,AI助手在与手机厂商深度合作后,操作手机能力和便捷调用大模型能力,成为一大亮点。
视频显示,用户可通过语音、侧边键或豆包Ola Friend耳机直接唤醒豆包,实现更便捷的交互。在任意界面使用手机时,用户都可以直接就屏幕内容向豆包手机助手提问以获取更多信息。同时,豆包手机助手也将语音通话、视频通话和屏幕共享等豆包用户常用功能嵌入助手中,用户双击侧边 AI 键即可调用。
多模态方面,豆包手机助手打通了系统原生相册,用户可直接在相册内通过语音对图片下达修图指令,例如删除人物、清理杂物等。
值得关注的是豆包手机助手的AI操作手机功能。据介绍,该功能可根据用户指令在多款应用间自动跳转,帮助用户完成类似查票订票、商品下单、批量下载文件、多软件物流进度一键查询等任务。
基于记忆,豆包手机助手还上线了操作手机Pro模式。该模式除调用GUI Agent(模拟点击)外,还可直接调用系统工具,结合记忆数据与更强的推理能力,帮助用户完成复杂任务。
官方视频举例称,在操作手机Pro模式下,当用户说“帮我给女儿推荐几个礼物放进购物车”时,若记忆中已存储女儿的年龄、兴趣等信息,助手可直接查询符合女儿年龄、偏好的方案,无需用户逐一交代细节。
不过,豆包手机助手也在官方视频的结尾特别提示,尽管演示内容均为真实录制,但受限于大模型技术的不确定性,相关场景无法保证百分百复现。当前产品实际可用性与团队预期仍有差距,未来仍将持续迭代优化。
大模型行业发展迅速,当前手机AI助手领域正呈现“手机厂商+大模型厂商”深度合作的清晰趋势。例如谷歌Gemini与三星的合作探索,已为行业提供跨界协同的参考样本。