• 最近访问:
发表于 2025-08-12 06:11:50 股吧网页版
用时间积累换突破——月之暗面专注通用人工智能领域
来源:经济日报

  走进北京海淀区知春路的一座大厦,玻璃幕墙折射着中关村的创新活力——这里正是近期备受关注的北京月之暗面科技有限公司(Moonshot AI),也是孕育开源大模型Kimi K2的地方。该模型7月份上线即登上全球开源模型榜单,并在开闭源总榜上排名第五。

  月之暗面创始人杨植麟告诉记者:“探索智能的极限、让AI有用,让每个人都能拥有真正普惠的AI,是公司创立的目标,也将引领公司走向更远的未来。”

  探寻可能

  2023年4月,在ChatGPT引发的AI大变革中,做了10年NLP(自然语言处理)工作的杨植麟和他的伙伴们一起创办了月之暗面,正如他们研究通用人工智能(AGI)的使命一样:探寻那些尚未被看见,却可能改变世界的可能性。

  与办公区朴素而低调的陈设形成鲜明对比的,是月之暗面拥有多个知名大模型研发经验的团队。“公司现有员工约300人,一半为‘90后’。”月之暗面副总裁张荣介绍,在算法和工程领域,研发团队囊括了自然语言处理、计算机视觉、强化学习、基础设施等方面的人才,开发出世界领先的深度学习框架,具备超大规模计算集群的运维和性能优化经验;在产品和运营领域,也吸引了一批来自国内“大厂”的技术骨干、资深产品经理及运营专家。

  随着顶尖人才“滚雪球”式涌入,企业不断产出研究成果。2023年10月,Kimi智能助手上线,成为首个支持20万字长文本的智能助手。有了这款智能助手,使用者能一次性输入大量信息,由模型理解进行问答和信息处理。

  此后,好消息接踵而至。2023年11月,Kimi开放平台上线;次年7月发布Kimi浏览器助手;2024年推出具备长文本分析和AI搜索功能的模型。今年,Kimi继续延伸:1月有了K1.5视觉思考模型;6月发布Kimi-Researcher深度研究模型,这款基于端到端自主强化学习技术训练的新一代智能体(Agent)模型,专为深度研究而生;7月面世的Kimi K2基础模型,则是开源万亿参数的基础模型。

  凭借很强的前端编程能力,在3D、游戏、动画制作等场景上,用简单的指令与Kimi K2交互,就能得到满意的结果。

  Kimi K2参数总规模达到万亿级别,激活参数却仅有320亿。这意味着,其能以更低的成本开展更加复杂的工作。目前,Kimi K2已接入部分国际主流开发平台。

  坚持创新

  “你好呀!我叫Kimi,是由月之暗面科技有限公司开发的大语言模型。我擅长用自然流畅的语言和你互动交流。可以帮你解答各种问题。虽然我没有感情,但我会尽力理解你的意图,给出清晰、有用的回答。有什么我可以帮你的吗?”打开kimi.com网页,在对话框中输入“介绍一下自己”,很快会跳出一段流畅的回答。

  短短两年打造出一个能力很强的AI助手,不仅因为月之暗面拥有一支实力雄厚的技术团队,还归功于其持续推动底层创新、解决方向性问题的技术理念。

  理念体现在最初产品的选择上。2023年10月,不同于其他大模型公司拼参数、展示各种各样的行业案例,Kimi智能助手让“长文本”成了绝对的主角。这个拥有超长记忆的AI助手,支持约20万汉字的上下文输入。使用者可以与Kimi聊天、发送网址链接、上传文件,由它随时回答问题、速读文件、整理资料、激发灵感、辅助创作。突出的“长文本”能力,让它从众多同期大模型中脱颖而出。

  如果把大模型想象成一台计算机,长文能力相当于内存。内存越大,能做的事情越多。坚持对数据无损压缩,不断提升模型能力,不走滑动窗口、降采样、小模型等技术捷径。半年内,月之暗面团队把长文本能力扩展至200万字。这份坚持赢得了大量用户的认可。2024年,Kimi用户量增长了100倍,从几十万跃升至几千万。

  对底层技术创新的坚持,不止体现在对无损长文本的执着中,也体现在后续产品的功能配置上。Kimi K2就是个典型,这款整体能力很强的开源模型上线后,迅速成为API(应用程序编程接口)调用量和下载量增长最快的大模型。

  Kimi K2在多项基准测试中都达到了最佳性能和最优表现,在自主编程、工具调用、数学推理三方面的能力更为突出:第一个是编程能力,相当于程序员的高考。如果能拿到高分,说明这个AI已经可以帮助软件工程师解决很多问题;第二个是工具调用能力,得分高代表它可以成为数字实习生,在现实中帮助人们完成任务;第三个对应数学推理能力,就像是一场数学竞赛,表现卓越就能跟尖子生“掰手腕”。

  Kimi K2成为闯进权威榜单前五名唯一的开源模型非常不容易。与在算法保密上煞费苦心的闭源模型不同,Kimi K2项目团队将智能和能力开放给了所有开发者,相当于把知名企业的顶尖能力从保险箱搬到一个公共货架上,谁都能用。

  实现突破

  “我们是典型的技术理想主义团队,用时间换空间,用积累换突破。”Kimi K2项目团队表示,作为一家专注通用人工智能的公司,月之暗面寻求将能源转化为智能的最优解,通过产品与用户共创智能,实现普惠AI。“我们把代码变成人人可用的工具,不再是程序员的专属。”

  计算机领域有很多方向,每个方向需要的技能不同。Kimi K2相当于一位多面手实习生,可以很大程度提升不同开发者的效率。用杨植麟的话说,“很多时候,一个模型表现成什么样子由平台决定,但每个人都有自己的偏好,都应该有个性化定制的机会”。

  AI助手能帮助人们做什么?当着记者的面,Kimi K2根据一句话用短短4分钟创建了一个3D森林,身处其中,按空格键就切换角度。写软件、做英语单词闪卡小应用、开发一个简单的游戏,都不在话下。

  其实,早在Kimi K2发布前,它就按项目组的要求,用自己的能力写出工具,“弹”响了公司门口的电钢琴。这证明它具备像人一样处理任务的能力。

  有了Agent能力,Kimi K2主动在各种环境中去探索使用工具、学习新技能,跟电子世界甚至真实世界进行交互得到反馈,进一步强化自主探索完成任务的能力。Agent能力,本质上是模型向下一个层级迈进,类似模型中的动物和人的主要区别。据Kimi K2项目团队介绍,具备运用工具的能力是大模型的重要迭代。这项能力去年在业内还没达成共识,Kimi K2开启了Agent智能时代,但目前也只是Agent领域的一个早期产品。

  告别被动的一问一答,想让模型学习能力更强,就得下功夫耐心打造更强大的基座模型。Kimi K2项目团队介绍,“我们拒绝了抢发模型的诱惑,先建好基座模型”。同时,训练Kimi K2时,首次将创新的优化器应用到万亿级别参数量规模的模型训练上,并且验证训练效率,实现了技术突破。

  与面向垂类客户的“超级员工”不同,月之暗面想做通用全能且超越人类智能水平的产品。公司尽可能发展通用、泛化能力,学会新技能反哺其他技能。杨植麟说:“通用技术更复杂、有更多瓶颈,是一条更难走的路。”

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500