美团发布并开源LongCat-Flash-Chat
来源:广州日报新花城
今年以来,美团人工智能的消息频繁传出。
记者获悉,9月1日,美团宣布LongCat-Flash-Chat正式发布,在Github、Hugging Face平台开源。据悉,LongCat-Flash采用创新性混合专家模型(Mixture-of-Experts,MoE)架构,总参数560B,激活参数18.6B~31.3B(平均 27B),实现了计算效率与性能的双重优化。此外,面向推理效率的设计和创新,LongCat-Flash-Chat具有明显更快的推理速度,更适合于耗时较长的复杂智能体应用。
记者了解到,美团此前就公布了AI Coding Agent工具NoCode、AI经营决策助手“袋鼠参谋”、酒店经营的垂类AI Agent“美团既白”等多款AI应用。美团方面表示,公司AI战略会建立在三个层面:AI at work、AI in products以及Building LLM,此次模型开源是其Building LLM进展的首度曝光。
具体来看,LongCat-Flash模型在架构层面引入“零计算专家(Zero-Computation Experts)”机制,实现算力按需分配和高效利用。此外,LongCat-Flash在层间铺设跨层通道,使MoE的通信和计算能很大程度上并行,提高了训练和推理效率。LongCat-Flash还对常用大模型组件和训练方式进行了改进,使用了超参迁移和模型层叠加的方式进行训练,并结合了多项策略保证训练稳定性,使得训练全程高效且顺利。
针对智能体(Agentic)能力,LongCat-Flash自建了Agentic评测集指导数据策略,并在训练全流程进行了全面的优化,包括使用多智能体方法生成多样化高质量的轨迹数据等,实现了优异的智能体能力。
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
评论该主题
帖子不见了!怎么办?作者:您目前是匿名发表 登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》