10月20日,在全球智能机器人与系统大会(IROS)时隔19年重返中国内地之际,美团(03690.HK)于大会期间,在杭州举办“机致生活Robotics for Better Life——2025美团机器人研究院学术年会”。
会上,美团副总裁、美团机器人研究院理事长毛一年、香港大学教授席宁、禾赛科技(02525.HK)创始人李一帆、自变量机器人CEO王潜等发表主题演讲,围绕“具身智能商业化”“机器人感知、规划和控制”等议题展开探讨;来自宇树科技、星海图等企业的负责人共同参与圆桌论坛,探究具身智能发展的“第一性原理”。
毛一年明确指出,到本世纪30年代,随着技术革新涌现,具身智能时代有望开启。而群贤毕至的这场学术年会,也成为观察美团在具身智能领域战略布局的一扇窗口。

投资版图
美团向业界展示了公司与IDEA研究院联合研发的智能避障系统,该系统在无人机方向,对风筝、气球等复杂目标的识别召回率提升近30%,误检率降至0.68%;与清华大学等高校合作的仿生软体手研究已获IROS等顶级会议收录,即将进入本地生活场景验证。
在宇树科技创始人王兴兴、浙江大学、清华大学多名教授出席的年会圆桌论坛上,王兴兴提到,随着人工智能技术发展到一定水平,机器人对硬件性能的依赖将逐渐降低。王兴兴坦言,尽管宇树科技本身专注于硬件研发,但必须承认“AI能力越强,对硬件性能依赖将越低”是行业现实趋势。
宇树科技正是美团在具身智能领域的关键投资之一。
2024年2月和9月,美团分别通过B+轮和C轮连续投资,稳坐宇树科技第二大股东位置。这种产研联动的模式,凸显了美团“场景反哺技术”的战略思路。
事实上,美团对具身智能的布局早已系统化展开。
截至2025年7月,美团通过战投和龙珠资本连续投资了有华为和百度(09888.HK)Apollo背景的它石智航、有Waymo和Momenta背景的星海图以及自变量机器人等6家机器人公司。
《量子位》统计称,若将时间拉长至2023年,美团创始人王兴旗下的基金已累计投资7家具身智能企业,美团战投和美团龙珠在具身智能头部8家行业公司融资记录中出现9次,成为行业最活跃的产业资本。
再往前,2021年,美团龙珠全年投资16起,其中5笔投向“硬科技”;2022年硬科技投资占比升至64%;2023年投资9笔,有8笔均为硬科技项目。
值得注意的是,美团于2022年11月29日正式成立美团机器人研究院。
软硬协同
美团如此密集落子“硬科技”的动机,可从业务本质与时代机遇两个维度解读。
业务层面,即时零售的竞争正从补贴战转向效率战。2025年暑期,美团日订单量突破1.5亿单,但骑手成本占总收入比例长期高企。此前美团2021年数据显示,外卖骑手成本支出为682亿元,占餐饮外卖总收入963亿元的71%。天风证券测算表明,无人配送大规模应用可为企业节约百亿元量级成本。
更深层的原因在于王兴对科技范式的判断。
早在2017年提出“互联网下半场”理论时,王兴即强调“上天”,即高科技的重要性。2021年,美团战略从Food+Platform升级为“零售+科技”后,公司明确将AI和机器人作为核心方向。在2024年财报电话会上,王兴直言:“我们对AI的策略是进攻而不是防守”。这种思路使美团的投资逻辑从“业务需要什么机器人”转向“基础设施以什么为载体”,具身智能被视作连接数字与物理世界的新一代基础设施。
美团的布局呈现出清晰的层次性。
在技术底层,投资覆盖月之暗面、智谱AI等大模型公司;在硬件载体端,通过投资宇树、银河通用等企业布局人形机器人;在场景落地层,则围绕本地生活需求展开协同创新。例如,2025年3月,美团买药与银河通用合作的智慧药房解决方案,首次在北京推出24小时机器人值守的无人药店,预计年底前扩展至全国100家。
这种“产-学-研-用”闭环在机器人研究院的运作中尤为明显。研究院自2022年成立以来,既开展无人机避障等前沿研究,也举办低空经济挑战赛吸引全球120支高校队伍参赛,包括清华大学、香港科技大学、新加坡国立大学、加州大学圣地亚哥分校等。
开放生态的建设,也与王兴所说的“在AI时代继续扮演连接者角色”一脉相承。
尽管布局深入,美团仍面临商业化平衡的挑战。截至2024年底,美团无人机配送已开通53条航线,自动配送车累计完成近500万单,但末端100米配送仍需人工辅助或外卖柜。
正如王兴兴在年会圆桌论坛指出,具身智能绝非“把DeepSeek塞进宇树机器人”那么简单,软硬件协同是行业需要迈过的关键门槛。
与王兴兴的言论相呼应,美团大模型团队近期也发力频频。
9月22日,美团旗下龙猫LongCat团队宣布开源高效推理模型LongCat-Flash-Thinking。这是美团继9月1日发布5600亿参数模型LongCat-Flash-Chat后,美团AI大模型的又一新动作。10月20日,LongCat团队发布VitaBench,VitaBench以外卖点餐、餐厅就餐、旅游出行三大高频场景为载体,构建包含66个工具的交互式评测环境。作为一个高度贴近真实生活场景、面向复杂问题的大模型智能体评测基准,该评测旨在提升人工智能在真实环境中的适应能力。