理想汽车李想谈VLA司机大模型：这是进化的过程_理想汽车(usli)股吧

股吧首页 > 理想汽车吧 > 正文

最近访问：

理想汽车吧

返回理想汽车吧>>

- 重要股东股权质押数据全览

理想汽车资讯

发表于 2025-05-12 17:52:39 股吧网页版

理想汽车李想谈VLA司机大模型：这是进化的过程

来源：广州日报新花城

　　日前，“理想AI Talk第二季”举行。此次，理想汽车董事长兼CEO李想重点分享了对于人工智能的最新思考，VLA司机大模型的作用、训练方法和挑战，以及对于创业和个人成长的见解。

　　李想将AI工具分为三个层级，分别是信息工具、辅助工具和生产工具。目前，大多数人将AI作为信息工具使用，但信息工具常伴随大量无效信息、无效结果和无效结论，仅具参考价值。成为辅助工具后，AI可以提升效率，例如现在的辅助驾驶，但仍需人类参与。未来，AI发展为生产工具后，将能独立完成专业任务，显著提升效率与质量。

　　李想表示：“判断Agent（智能体）是否真正智能，关键在于它是否成为生产工具。只有当人工智能变成生产工具，才是其真正爆发的时刻。就像人类会雇佣司机，人工智能技术最终也会承担类似职责，成为真正的生产工具。”

　　VLA全称是Vision-Language-Action Model，即，视觉语言行动模型。李想认为，它能够让AI真正成为司机，成为交通领域的专业生产工具。“对理想汽车而言，未来的VLA就是一个像人类一样工作的司机大模型”。

　　李想介绍，VLA的实现不是一个突变的过程，是进化的过程，经历了三个阶段，对应理想汽车辅助驾驶的昨天、今天和明天。第一阶段，理想汽车自2021年起自研依赖规则算法和高精地图的辅助驾驶，类似“昆虫动物智能”。第二阶段，理想汽车自2023年起研究，并于2024年正式推送的端到端+VLM（Vision Language Model，视觉语言模型）辅助驾驶，接近“哺乳动物智能”。

　　端到端模型在处理复杂问题时存在局限，虽可借助VLM视觉语言模型辅助，但VLM使用开源模型，使其在交通领域的能力有限。同时端到端模型也难以与人类沟通。为了解决这些问题并提升用户的智能体验，理想汽车自2024年起开展VLA研究，并在多项顶级学术会议上发表论文，夯实了理论基础。

　　在端到端的基础上，到第三阶段，VLA将开启“人类智能”的阶段。它能通过3D和2D视觉的组合，完整地看到物理世界，而不像VLM仅能解析2D图像。同时，VLA拥有完整的脑系统，具备语言、CoT（Chain of Thought，思维链）推理能力，既能看，也能理解并真正执行行动，符合人类的运作方式。

　　得益于DeepSeek的开源，理想汽车在VLA司机大模型的语言能力研发上提速显著，节省了近9个月的时间和数亿元成本。尽管如此，理想汽车仍选择加大投入，在基座模型上投入超预期3倍的训练卡，专注打造适配多场景的自研模型。李想表示：“我们可以站在巨人的肩膀上，但它只是其中的一部分。”在受益开源的同时，理想汽车也选择开源自研的汽车操作系统——理想星环OS，回馈社会。

　　面对AI的发展，李想认为，在AI面前所有的人性都应被保留，无论好坏，因为一切人性都是文化、生命、性格、能力的特质，也是人类真正的生命力所在。

（文章来源：广州日报新花城） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

郑重声明：用户在社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》