一带一路

近日，全球最大的语音会议 INTERSPEECH 2020公布了 SdSV 声纹识别比赛成绩，网易 AI Lab 从众多国际顶级队伍中脱颖而出，获文本相关声纹识别赛道综合排名第一、单模型第一的双料冠军。彰显了网易 AI Lab 在语音声纹识别技术领域的领先地位。

本次国际声纹识别比赛的参赛队伍来自国际多家知名高校与企业，包括近两年全球各项声纹识别比赛中的“常胜将军”:布尔诺工业大学、新加坡通信研究院、约翰霍普金斯大学。

比赛中，网易 AI Lab 基于常见的 X-Vector 和 PLDA 算法，创新地提出了一种 ASR-free 的文本相关声纹识别算法。相比传统的 Deep Speaker Embedding 方法，该算法不需要依赖语音识别，就能够在多语言环境下，同时完成说话人和文本内容的验证。

比赛采用 MinDCF(最小检测代价)和 EER(等错误率)作为评测指标。网易 AI Lab 的单模型在两个指标均为最佳，其中EER达到了1.67%，相比第二名降低了11.6%，并远低于比赛 X-Vector 基线系统(EER=9.05%)。EER 是判断声纹识别算法系统的综合指标，EER 越小，系统性能越佳。

声纹识别技术多应用于安防等场景中，而网易 AI Lab 声纹识别技术其实早已被运用于游戏场景中。除了进行游戏身份验证，还能够针对音色对用户进行分类、丰富玩家画像，从而更加精准地为玩家推荐志趣相投的好友、匹配实力相当的对手，为玩家带来更好的游戏体验。

网易 AI Lab 斩获全球顶级声纹识别竞赛冠军