• 最近访问:
发表于 2025-10-15 18:41:09 股吧网页版
清华大学与巨人网络联合首创多方言语音合成大模型框架
来源:上海证券报·中国证券网 作者:罗茂林


K图 002558_0

  上证报中国证券网讯(记者罗茂林)10月15日,记者从巨人网络获悉,巨人网络AI Lab与清华大学电子工程系SATLab的研究团队联合首创多方言语音合成大模型框架DiaMoE-TTS,数据代码方法全开源,借此推动方言语音合成的公平与普惠。

  在当今大模型引领的语音合成时代,通用TTS系统已展现出令人惊叹的能力,但方言TTS依然是相关从业者难以触及的“灰色地带”。现有的工业级模型往往依赖巨量专有数据,这让方言TTS从业者和研究者几乎无从下手:缺乏统一的语料构建方法,更缺乏一个可实现多语言的端到端开源框架。

  据悉,双方联合首创的DiaMoE-TTS,这是一个在一定程度上媲美工业级方言TTS模型的开源全套解决方案。他们基于语言学家的专业经验,构建了一个统一的IPA表达体系,并且在仅依赖开源方言ASR数据的前提下提出这一方案。

  在推出广东话、四川话、上海话等中文方言版本之前,研究团队已在英语、法语、德语、荷兰比尔茨语等多语种场景中进行验证,确保该方法具备全球范围内多语言的可扩展性与稳健性。

  巨人网络AI Lab与清华大学电子工程系SATLab希望借此推动方言语音合成的公平与普惠,让任何研究者、开发者乃至语言文化保护工作者都能自由使用、改进与扩展这一框架;让小众语言与方言不再被淹没在通用大模型洪流中,而能通过开源的力量被更广泛地听见与传承。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500