【A03】智能家居场景说话人识别挑战赛【移动创新院】
发布时间: 2022-11-24 15:03:25

本届A类赛题可通过以下方式提问与交流:

1、大赛官网团队账号-赛题答疑区提问,组委会定期收集问题提交至企业解答后公布;

2、可前往赛题答疑论坛(PC端点击链接)https://mastergo.com/file/77782156635006?utm_source=fwwb&utm_medium=saitishouce&utm_campaign=&utm_term=&utm_content=提问或交流,企业定期回复。


1.命题方向

智能语音

2.题目类别

计算类(重点围绕新产品的指定模块开发计算,考察开发能力)

3.题目名称

智能家居场景说话人识别挑战赛

4.背景说明

【整体背景】

说话人识别属于生物特征识别技术,是通过对收到的说话人语音信号进行分析和提取,自动地确定说话人是否在所建立的说话人集合里面,并确定说话人是谁的过程。说话人识别技术具有低成本、弱隐私、无接触等优点,在金融、安防、司法等领域有着广泛应用前景。

近年来,随着计算机技术的飞速发展以及大数据的积累,深度学习相关技术,如说话人识别取得了突破性发展。但是在实际应用中,例如语音助手、安防等场景依然面临着很多挑战。

【公司背景】

中国移动(浙江)创新研究院是中国移动浙江公司与中国移动通信集团研究院共同组建成立的集团级研发单元,于20217月由浙江省委书记袁家军和中国移动董事长杨杰共同揭牌成立。中国移动(浙江)创新研究院按照集团的战略定位,创新推动5G、人工智能、大数据等新兴技术的融合应用,加快推进新一代信息技术深度融入经济社会民生,推动以“九天”人工智能为代表的中国移动集团战略型核心成果规模化应用和价值转化,全力支撑做强做优做大数字经济,立足长三角,辐射全国,建成国家级新型研发机构,打造国内领先的人工智能创新中心。

北京希尔贝壳科技有限公司成立于2017年,是一家专注人工智能大数据和技术服务的创新公司。针对家居、车载、机器人等语音智能产品做精准场景语音数据并输出方案。利用机器学习平台,在语音数据评测、辅助转写、数据分析、智能语音客服等场景业务建立了领先的核心技术体系。拥有29项知识产权,包括场景噪声影响分析评价软件,文本自动分词软件,语音录制软件,语音智能识别系统,智能电话呼叫语音检索软件,智能多段落语音标注软件,智能语音标注系统,智能语音分析软件。与产业、高校共同建设实验研发平台,为人工智能大数据服务不断做创新并联合发表多篇顶级学术论文。希尔贝壳在语音场景大数据领域的数据集建设已经达到了国际领先水平,部分产品已成为产学研的标准。

【业务背景】

希尔贝壳在语音数据集的研究和科学验证上不断创新,声纹识别技术在智慧安防与金融等领域被广泛应用,对产品在说话人识别、定位、内容的准确匹配是目前主流的技术应用。为更好的解决实际场景的技术问题,本命题围绕产品跨设备、多距离的声纹识别技术实践为目标,挑战解决实际产品问题。

5.项目说明

【问题说明】

说话人识别技术虽然得到了显著发展,但是实际应用场景中的众多干扰因素依然是其落地的壁垒。同一说话人在不同时间和口音状态下的语音特征,收音设备的差异、背景噪声、距离等因素都会影响说话人识别的结果。有效的解决这些问题,进一步提升说话人识别的准确率,促进其相关产品更好的落地。

【用户期望】

利用深度学习等相关算法解决说话人识别中的两大问题:

1)跨设备问题:不同设备之间存在不同的信道噪声,这些对人耳来说看似无区别的声音,对机器来说却很明显,如何从不同设备的数据中获取到有效的信道信息,并在实际使用中消除信道噪声对声纹识别的影响。

2)近远讲问题:实际使用场景中,会同时涉及到近讲和远讲的问题,如手机助手近讲,音箱、电视等一般远讲,如何同时满足近远讲的场景下对说话人识别的高准确率,解决真实场景中产品落地的应用问题。

6.任务要求

【开发说明】

本赛事使用的数据来自希尔贝壳AISHELL-WakeUp-1数据库的子集HI-MIA数据集。HI-MIA数据集覆盖近讲麦克风和距离说话人前方1米、3米、5米的麦克风数据,数据内容为中文普通话“你好,米雅”内容,其中做说话人识别模型训练用数据集200人,开发集20人,测试集30人。

录制示意图如下:

【技术要求与指标】

模型训练仅限于赛事提供的数据集,在指定平台上完成说话人识别系统的搭建与优化,并完成以下两个赛道中至少一个赛道的结果提交:

1)近讲数据注册,近讲数据测试:即用高保真近讲麦克风作为注册语音,将高保真近讲麦克风作为测试语音;

2)近讲数据注册,远讲数据测试:即用高保真近讲麦克风作为注册语音,将1米的远讲设备数据作为测试语音;

需要在九天毕昇人工智能平台上进行算法的实现以及模型的训练。

【提交材料】

1)项目概要介绍;

2)项目简介PPT;

3)项目详细方案;

4)项目演示视频;

5)企业要求提交的材料:

①需要借助九天毕昇人工智能平台完成作品

6)团队自愿提交的其他补充材料。

【任务清单】

1)分析结果数据情况;

2)完成所选赛道的系统搭建。

【开发工具与数据接口】

平台为指定的在线实验平台。

7.其他

8.参考信息

针对参赛团队

1)提供基于Pytorch的基线系统作为示例参考;

2)提供赛事期间的免费线上课程。

9.评分要点

赛题评分要点见附件A 类企业命题初赛统一评分标准。

除此之外企业还重点关注

1)等错误率:模型最后在测试集上的准确率;

2)算法创新性:模型网络结构的创新性;

3)鲁棒性:系统针对不同测试数据的效果稳定性;

4)系统展示:提交说明完整清晰,逻辑合理,能准确表达系统框架。



订阅号