端侧大模型应用赛道现新融资。
近日,面壁智能宣布,完成新一轮数亿元融资,本轮融资由洪泰基金、国中资本、清控金信和茅台基金联合投资。
面壁智能是目前市场上少数还能持续顺利融到资的大模型企业,“在DeepSeek出现之后,大模型公司事实上都面临着融资困难的问题。面壁智能能顺利融资,反映出公司坚持走的‘端侧路线’被市场看好。”
面壁智能成立于2022年,专注大模型技术创新与应用转化。创始团队出身于清华系,来自清华大学自然语言处理实验室。此前曾任职于知乎的李大海,于2023年出任面壁智能CEO。另一名联合创始人、首席科学家刘知远,则是清华大学计算机科学与技术系副教授。
今年1月,面壁智能发布了首个端侧全模态模型“小钢炮”MiniCPM-o 2.6,以8B规模实现全模态实时交互。据公司方面介绍,截至目前,面壁小钢炮MiniCPM系列全平台下载量累计破1000万。
在端侧AI的商业化布局上,面壁智能亦进展迅速。
李大海介绍,在汽车领域,公司今年发布了“小钢炮超级助手cpmGO”,是一个落地车端的纯端侧智能助手,基于MiniCPM,在车规级SoC上本地完成语音、视觉、车控推理,带来与云端全面对齐的“原生端侧体验”。
为了加速端侧模型在汽车领域的落地速度,面壁智能还与高通、英特尔、联发科技、梧桐车联、德赛西威、中科创达、安波福等标杆企业展开合作。今年4月,搭载端侧模型的量产车型长安马自达MAZDA EZ-60正式亮相。
“在具身机器人领域,我们携手加速进化机器人,打造出完整具身智能的先驱方案,具身机器人能够根据人类语音命令,选择不同颜色小球,开球、简单控球、指定门框射门,还能够实现基于真实场景的多轮次大模型文本交互,语音回复或任务执行,领先业内实现高效端侧模型在人形机器人上的应用。”李大海说。
此前,面壁智能一直强调“端侧大脑”,从技术原理上看,它与传统的云端大模型主要区别有哪些?
李大海认为,在任何技术领域,把一个较大的东西做小都是一件非常难的事情,大模型也不例外,需要从算法、架构、数据、训练、甚至诸多工程层面创新,才能让大模型知识密度持续提升,从而让“即使模型参数变小,也能实现效果、性能比肩云端模型成为现实”;让终端设备无需联网就能拥有与“持续看、实时听、自然说”能力;也为诸如汽车、手机、机器人等广泛的终端场景带来了更低成本、更高可靠性与更好隐私程度的AI体验。
比如,在数据层面,为了能更加低成本、高效的训练,面壁智能通过技术手段去筛选对提升模型效果最有效的数据,实现高效训练的目标;在模型训练方面,也会采用类似于风洞实验的训练手段,快速探索和验证最有效的模型配置。
在模型压缩、推理速度提升等方面,李大海介绍,MiniCPM 3.0仅4B参数,在自然语言理解、知识、代码、数学等多项能力上对GPT-3.5实现赶超。
“端侧模型与硬件结合,是目前相对清晰的商业模式,也相信诸如汽车、手机等目前也是落地端侧模型的最佳领域之一。未来,我们会持续与车企、合作伙伴和芯片厂商协同,在能力适配、端侧性能稳定性等方面开展更加深入的合作。”
《科创板日报》记者了解,在端侧大模型方面,DeepSeek R2通过架构创新、国产芯片适配和极致压缩技术,实现了在手机、车机、工业控制器等边缘设备上的部署。
云天励飞作为“深圳人工智能第一股”,主营业务是利用芯片和算法能力给政务类场景提供视觉解决方案。近年来,其将业务拓展到边缘AI领域,通过自研边缘训推芯片和多模态大模型,赋能AI模盒,并计划将大模型赋予到耳机、智能手表和智能音箱等AIoT产品上。
自2024年以来,面壁智能已完成3轮融资,投资方包括智谱、知乎、哈勃投资、北京市人工智能产业投资基金等。
值得一提的是,本次面壁智能的融资中出现了茅台的身影。作为投资方之一的茅台基金,是由茅台集团与建行旗下的建信信托发起设立的私募股权投资基金。
财联社创投通显示,成立以来,茅台基金参与投资19个项目。从参投项目的领域来看,茅台基金的出手集中在生物医药、新消费及餐饮食品领域。在人工智能产业链,茅台基金此前还曾出手从事AI智能视觉芯片等开发的稻源科技。