[发明专利]远场拾音性能评价方法和系统、电子设备有效
申请号: | 201710703506.2 | 申请日: | 2017-08-16 |
公开(公告)号: | CN107403629B | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 熊亨;戴天荣;蔡磊 | 申请(专利权)人: | 歌尔股份有限公司 |
主分类号: | G10L25/69 | 分类号: | G10L25/69 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈 |
地址: | 261031 山东省潍坊*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 远场拾音 性能 评价 方法 系统 电子设备 | ||
本发明公开了远场拾音性能评价方法和系统、电子设备。通过电子设备统一调用多个语音识别引擎对拾音设备分别进行语音拾取的音频文件进行语音识别,得到与多个语音识别引擎对应的识别正确率,进而根据所述音频文件的多个识别正确率和对所述拾音设备的拾音性能进行评价,因此本发明所述系统可以实现对远场拾音系统中用于声音拾取的拾音设备的拾音性能进行客观、正确地测试评价。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种远场拾音性能评价方法和系统、电子设备。
背景技术
通常,评价一个远场拾音结果的好坏主要取决于拾音系统所采集的拾音效果。目前,对拾音效果的评价分为主观评价和客观评价两种方式。
其中,在主观评价的方式中,通过播放一段干净的未失真的语音信号,经过拾音系统拾取之后,在接收端让一组人员去听,然后给出一个1-5分的拾音效果评分,所有受试人员的平均分,作为最终的拾音效果评分,采用这种方法的缺点是:耗时、费力、且对受试人员的要求较高。
常用的客观评价方法有:感知话音质量测量法(Perceptual Speech QualityMeasure,简称PSQM),感知分析测度系统法(Perceptual Analysis Measurement System,简称PAMS),感知话音质量评估法(Perceptual Evaluation of Speech Quality,简称PESQ)等。这些客观评价测试方法和测试仪器都是应用于端到端的通信拾音效果测量的,测试仪通过模拟电话接口来测试端到端的网关之间的拾音效果,存在的缺点是:只能应用于具有电接口(比如网关、或者模拟音频接口)的语音系统或设备,而不能应用于远场拾音效果的正确测试评价,也不能对远场拾音系统中用于声音拾取的音响设备的拾音性能进行正确测试评价。
发明内容
为了解决上述问题,本发明提供一种远场拾音性能评价方法和系统、电子设备,可以对远场拾音效果进行正确测试评价,还可以用于对音响拾音性能进行客观正确的测试评价。
本发明提供一种远场拾音性能评价方法,包括:
在预设的环境信息下,获取拾音设备对语音播放的原始文本文件进行语音拾取得到音频文件;
通过多个语音识别引擎分别对所述音频文件进行语音识别,得到所述音频文件的多个识别正确率;
根据所述音频文件的多个识别正确率对所述拾音设备的拾音性能进行评价。
可选地,通过多个语音识别引擎分别对所述音频文件进行语音识别,得到所述音频文件的多个识别正确率,包括:
通过多个语音识别引擎分别对所述音频文件进行语音识别,分别得到与所述多个语音识别引擎一一对应的多个识别后的文本文件;
将所述多个识别后的文本文件分别与所述原始文本文件进行对比,分别确定所述音频文件的多个识别正确率。
可选地,根据所述音频文件的多个识别正确率对所述拾音设备的拾音性能进行评价,包括:
根据所述音频文件的多个识别正确率,计算所述音频文件的平均识别正确率;
根据所述音频文件的平均识别正确率,评价所述拾音设备的拾音性能。
可选地,若所述预设的环境信息包括多个环境信息,则拾音得到与各个环境信息一一对应的音频文件,进一步地,所述音频文件的平均识别正确率与其对应的环境信息对应。
可选地,所述的远场拾音性能评价方法还包括:
根据所述音频文件的平均识别正确率以及对应的环境信息,评价在不同环境信息下所述拾音设备的拾音性能。
可选地,所述的远场拾音性能评价方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于歌尔股份有限公司,未经歌尔股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710703506.2/2.html,转载请声明来源钻瓜专利网。