• 最近访问:
发表于 2025-06-27 23:11:00 股吧网页版
腾讯,大动作!
来源:中国基金报

K图 00700_0]

  【导读】腾讯混元推出首款开源混合推理模型,擅长Agent工具调用和长文理解

  头部互联网公司旗下大模型加速开源。

  6月27日,腾讯混元开源的首款混合推理MoE模型Hunyuan-A13B发布,该模型是业界首个13B级别的MoE开源混合推理模型,其效果比肩同等架构领先开源模型。

  开源模型灵活性、透明度和成本优势,为人工智能产业发展带来新机遇。今年年初DeepSeek出圈后,腾讯、阿里、字节等头部互联网公司旗下大模型开源悄然加速。

腾讯混元开源首款混合推理MoE模型

  腾讯混元宣布开源首个混合推理MoE模型Hunyuan-A13B,总参数80B,激活参数仅13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高,这意味着,开发者可以用更低门槛的方式获得更好的模型能力。

  即日起,模型已经在Github和Huggingface等开源社区上线,同时模型API也在腾讯云官网正式上线,支持快速接入部署。

  据了解,这是业界首个13B级别的MoE开源混合推理模型,基于先进的模型架构,Hunyuan-A13B表现出强大的通用能力,在多个业内权威数据测试集上获得好成绩,并且在Agent工具调用和长文能力上有突出表现。

  *加粗为最高分,下划线表示第二名,数据来源于模型各个公开的测试数据集得分

  在实际使用场景中,Hunyuan-A13B模型可以根据需要选择思考模式。快思考模式提供简洁、高效的输出;慢思考则涉及更深、更全面的推理步骤,如反思和回溯。

  Hunyuan-A13B模型对个人开发者较为友好,在严格条件下,只需要1张中低端GPU卡即可部署。目前,Hunyuan-A13B已经融入开源主流推理框架生态,无损支持多种量化格式,在相同输入输出规模上,整体吞吐量是前沿开源模型的2倍以上。

  Hunyuan-A13B集合了腾讯混元在模型预训练、后训练等多个环节的创新技术,这些技术共同增强了其推理性能、灵活性和推理效率。

  腾讯方面相关人士表示,Hunyuan-A13B模型是腾讯内部应用和调用量最大的大语言模型之一,有400+业务用于精调或者直接调用,日均请求超1.3亿次。

  本次进行升级更新并对外开源,是继混元Large后混元大语言模型推出的又一重要开源模型,其参数更小,但是性能和效果实现了大幅的提升。接下来,腾讯混元将推出更多尺寸、更多特色的模型,将更多实践技术与社区共享,促进大模型开源生态的繁荣。

开源浪潮席卷行业

  2024年大模型从科技前沿走向大众视野,2025年DeepSeek火爆出圈,开源正在成为国内外众多大模型的“必选项”。

  据不完全统计,仅今年3月至今,OpenAI、谷歌、Meta、英伟达、阿里、DeepSeek、智谱AI、群核科技、阶跃星辰等全球多家科技巨头已密集发布超10款开源大模型。

  与此同时,开源模型性能持续突破,AI开源社区Hugging Face的模型榜单不断被刷新。无论是科技巨头,还是初创企业,都在加快步伐拥抱开源浪潮。共享最新前沿技术成果的同时,这些企业也在致力于降低算力成本。

  就国内而言,字节跳动豆包、昆仑万维、百度文心、阿里通义千问等今年均推出开源模型。当前,头部互联网公司旗下大模型开源仍在加速。

  5月30日凌晨,阿里巴巴开源了创新自主搜索AI Agent——WebAgent。WebAgent具备端到端的自主信息检索与多步推理能力,就像人类一样在网络环境中主动感知、决策和行动,例如,当用户想了解某个特定领域的最新研究成果时,WebAgent能够主动搜索多个学术数据库,筛选出最相关的文献,并根据用户的需求进行深入分析和总结。

  字节跳动Seed团队也有新动作,发布并开源了多模态基础模型BAGEL,该模型拥有70亿个活跃参数,总参数达140亿个。BAGEL集视觉理解、文生图、图像编辑于一体,在标准多模态理解基准测试中表现出色,优于现有顶级开源视觉语言模型如Qwen2.5-VL和InternVL-2.5。

  麦肯锡公司联合Mozilla基金会、Patrick J.McGovern基金会发布的《AI时代的开源技术》报告显示,全球超过50%的企业已在数据、模型及工具层面采用开源AI技术。

  开源模型通过提供高质量的模型权重和训练代码,支持模型的预训练、微调和定制,助力科创企业基于现有的强大模型进行快速开发,避免了从头开始构建AI系统的高昂成本。企业可依据业务所需灵活调用模型组件、算法框架和推理引擎,实现从“重资产开发”到“轻量化集成”的转型路径,大幅降低了创新门槛和试错成本。

  据了解,未来混元计划推出多尺寸混合推理模型,从0.5B到32B的Dense模型,以及多个MoE模型,适配企业与端侧不同需求,混元图像、视频、3D等多模态基础模型及配套插件模型也将持续开源。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500