2月12日,国内音乐大模型初创公司——自由量级正式推出音乐大模型音潮V3.0版本,据悉此次迭代完成了从“编码—生成—解码”的全链路技术重构,实现音乐性与良品率的双重突破。
《中国经营报》记者注意到,自由量级有这样的行业预判:2026年伊始AI音乐赛道正迎来从“野蛮生长”到“专业进阶”的关键转折,多家国内外音乐模型相继完成技术升级,行业从“能生成音乐”向“生成好听、有温度的音乐”深度进化。
而在AI音乐生成领域,仅仅增加参数规模已不再是竞争的核心。行业内不再满足于让机器一味效仿声音的波形,而是试图让它理解声音背后的物理空间与情感逻辑。
首先,音潮V3.0通过引入双轨建模与多阶段强化学习,大幅提升了歌曲的演唱质量,不仅学会了哼唱、转音、气声等极其细腻的演唱技巧,更拥有了充沛的情感表达力。
其次,音潮V3.0带来了旋律悦耳度与记忆性的质变——让每首歌都拥有“闪光点”。现在的AI音乐或多或少都有“听起来顺畅,但听完就忘”的通病,而音潮V3.0生成的旋律线条更加流畅,音符间的张力起伏更具设计感。几乎每一条生成的旋律,都拥有值得被记忆的Hook(记忆点)。
另外,此次音潮V3.0在编曲多样性与音乐整体性上也实现了显著增强。V3.0从乐器的音色选择到段落间的起承转合,整体性得到了极大的提升。同时,为了重塑声音的物理质感,音潮V3.0为相位和混响独立建模,并应用到整体生成链路上,这让我们可以听到电吉他失真时的颗粒感、鼓点落下时的空气震动,以及混音中细腻的空间残响。
“模型如果只是聚焦专业生产场景,在价值层面就会滑向冰冷的工具,很容易忽略了普通人情感表达的需求。所以,音潮模型迭代的出发点,始终关注用技术让音乐创作的门槛大幅降低。每一项技术重构和突破,都最终指向让‘音乐平权’从理念落地为现实。”自由量级CTO姜涛表示。