25支参加单机舞蹈的队伍中,有不少使用宇树科技G1机器人,但只有北京通用人工智能研究院(以下简称“通研院”)是基于通研院-宇树科技具身智能与人形机器人联合实验室和宇树科技联合出战。
8月16日下午,这支结合了两家名字的BIGAI-Unitree战队在世界人形机器人运动会单机舞蹈项目获得冠军,1分多的舞蹈表演中,BIGAI-Unitree战队“通小舞”机器人既展示了中式古风、太极的部分动作,也表演了西式的恰恰、交谊舞、摇摆舞动作。
作为新型研发机构,通研院与宇树科技以“算法+硬件”分工模式合作,探索机器人从实验室走向真实场景的路径。在北京商报记者对通研院(BIGAI)具身机器人中心执行主任黄思远的专访中,研发机构与企业赛队切入具身智能的角度,对应用场景的不同理解完整呈现。在他看来,得到舞蹈赛事冠军非常满意,赛场暴露的问题也很珍贵。
Q:这次通研院参与了哪些比赛项目?
A:我们使用了宇树科技的机器人硬件,利用自主研发的算法,联合组建了BIGAI-UNITREE战队,参加了单机舞蹈表演赛、场景技能竞技赛,包括酒店场景-清洁服务以及酒店场景-迎宾服务,参赛的是基于宇树科技G1双足人形机器人本体,额外搭载了通研院的硬件、算力识别系统的机器人。
Q:为什么选择这两个项目?
A:我们在机器人运动控制、视觉交互和物理交互方面有很长时间的积累。通研院是做算法的,就是“大脑”,在本体基础上的交互控制、模型侧的应用会更擅长一些。
Q:您认为通过参赛人数倒推比赛难度的方法准确吗?
A:不完全准确。有些比赛是同样的机器人本体在参赛,但背后是不同的队伍,这样参赛的队伍会显得比较多,比如径赛,100、400、1500米。单纯从难度来看,1500米对机器人的耐心等有比较高的要求,我认为难度比较高。像场景赛,比如舞蹈项目,它对精准度要求高,而且场景赛涉及交互和环境适应,实现难度也不低。
Q:抛开参赛方的身份,您更关注哪类比赛?
A:我比较关注一百米赛跑,因为这是对机器人速度的极限比拼,同时考验机器人动态平衡与运动控制的能力,需在动力、控制、能效间找到最佳平衡点,比如机器人在高速奔跑时需实时调整重心,避免跌倒摔跤的情况,算法也需要优化步频、步幅与能耗。
Q:作为研究机构,与企业参赛有何不同?
A:通研院属于新型研发机构,我们和宇树科技一直有密切的合作关系,这次是根据各自在本体硬件和算法方面的优势做了一下分工。通研院将视线更聚焦于机器人“大脑”的开发,机器人通过深度集成“通智大脑”技术框架,提升机器人认知决策能力,解决了传统机器人“有身无智”的关键痛点,宇树科技等企业则更聚焦于机器人本体,他们更多把注意力集中在田径这部分,通研院来参加跳舞、场景赛等,起到以赛代练的效果。
Q:这次参赛遇到了什么技术挑战?
A:我们平时做研究主要在实验室,环境比较局限,比赛场地空旷,真机部署时会出现不一样的情况,比如现在所有比赛队伍都遇到了无线通讯带宽不够、互相干扰的问题。
如果想要机器人的模型算法稳定实现,最好是端侧部署,但现在的模型比较大,没办法做到所有模型都端侧部署,就需要依赖一些无线通讯,但因为信号的原因,大家花了很多时间解决这些通讯问题。
Q: 这些问题对研究机构意味着什么?
A:挺宝贵的,这些实际会出现的问题,对我们研究员走出实验室是一个很好的机会,会倒逼我们思考,否则这是要花很长时间才能发现的问题。
它涉及到未来模型设计的时候,怎样平衡模型的能力、大小和性能。作为研究人员,模型在机器人身上展示的效果越好,我们就越开心,但实际部署时不一定,所以未来我们可能不会一味地将模型规模加大,可能会用更小的模型、更好的算法,使它能更快地适应新的环境。
Q:这个经验对机器人应用落地有什么帮助?
A:快速适应环境新环境,而不是使用重新训练的方式,这对实际场景应用很重要,因为重新训练模式可能是不可持续的。
Q:赛前对成绩有什么预期?
A:舞蹈项目我们希望进入前三,场景赛因多数参赛队伍使用轮式机器人,我们使用双足机器人在速度上有劣势,没有太高目标,希望以最佳的表现完赛。这是全世界范围内,第一次举行人形机器人运动会,在规则上可能也需要摸索。
Q: 对这个冠军满意吗?
A: 对舞蹈赛的冠军非常满意,舞蹈赛有20多支队伍参赛,BIGAI-Unitree战队通过“通智大脑”核心技术获得了冠军,充分展现了我们的技术特色和风采,有很多小伙伴们加班加点地努力。场景赛的成绩我们有一些遗憾,因为通讯等问题没有完全展示技术的全部特色,这也给我们接下来的研究提供了一些方向和启示,同样也是这次大赛的经验和收获。