新闻资讯-音乐会

酷狗音乐自研技术荣获MIREX 2025双料冠军

发布时间:2025-10-24 12:19:38  浏览量:1

近日,腾讯音乐娱乐集团旗下的在线音乐流媒体平台酷狗音乐宣布,其自主研发的节拍提取技术与结构识别技术,在国际音频检索领域权威赛事MIREX 2025(Music Information Retrieval Evaluation eXchange)双赛道中力压群雄,双双夺冠。这一突破不仅彰显了酷狗音乐行业领先的技术实力,更是通过这些技术在「一键DJ」、「变乐器」、「Automix智能过渡」、「高潮听歌」等功能中的应用,为用户带来智能化与趣味性兼具的音乐体验。

节拍提取:端到端模型创新识别 打造个性化聆听感受

酷狗音乐在MIREX 2025中排名第一的节拍提取方案,是一个由Audio Encoder、MLP特征映射层和Transformer时序预测模块组成的端到端模型。该模型由三大模块协同工作,Audio Encoder负责从原始音频信号中提取深层特征,MLP层将特征映射为规范的Audio Tokens。最后,凭借Transformer网络强大的长程上下文建模能力,模型能够精准地从Audio Tokens序列中预测节拍序列。

这项技术的卓越之处在于其应对复杂节奏的能力,通过在包含大量复杂节奏的数据集进行多任务联合训练,该方案在节拍追踪的准确性表现优异,尤其在识别混合拍子时,展现出显著的性能优势与泛化能力。

目前,酷狗音乐这项顶尖节拍提取技术已深度融入多个蝰蛇音效产品功能中,成为提升用户体验的关键竞争力。在「一键DJ」功能中,精准的节拍信息是实现自动混音、无缝衔接不同歌曲的基础,让普通用户也能轻松创造出专业级的串烧舞曲。在「AI变乐器」玩法中,酷狗音乐技术能改变歌曲配器,提供钢琴、唢呐、骨笛、尤克里里等乐器选择,生成的伴奏严格贴合原曲节拍,保持音乐的和谐感。而在「Automix智能过渡」场景下,系统依赖精准的节拍点,在海量曲库中为用户当前播放的歌曲寻找到节拍、情绪都完美匹配的下一首,打造流畅的听歌旅程。

结构识别:多分支解构音乐结构 高潮听歌直击人心

在音乐结构识别赛道,酷狗音乐的顶尖方案同样展现出强大的创新性。该方案基于Allin1进行优化,通过增加标签分支和边界点分支联合预测结构边界和标签,显著提升结构识别准确率。此外,结合腾讯音乐娱乐集团高质量的训练数据,实现业界领先的识别性能。

结构识别技术的直观应用,便是酷狗音乐「高潮听歌功能」。酷狗音乐技术能精准定位副歌的高潮部分,直接标识出歌曲高潮点。用户点击高潮点,即可快速跳转至最激动人心的部分,极大满足在碎片化时间里直击精华的听歌需求。这一创新交互,让音乐播放变得更加灵活高效。

酷狗音乐在MIREX 2025中的优异表现,不仅体现了技术进步与应用落地的前沿性,更标志着中国音娱平台在自研技术上已步入全球第一梯队,具备了与国际同行同台竞技并领先的实力。从节拍提取到结构识别,为用户对音乐赏析及交互带来革命性变化,成为连接音乐内容与用户需求的智能桥梁。未来,酷狗音乐将持续深化技术研发与适配应用,为用户打造更智能化、个性化的音乐世界。

标签: 酷狗音乐 audio mirex encoder mlp
sitemap