[发明专利]语音识别的唤醒词选择方法及装置有效
申请号: | 201611208275.X | 申请日: | 2016-12-23 |
公开(公告)号: | CN106847273B | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 朱辉;王明明;闫子魁 | 申请(专利权)人: | 北京云知声信息技术有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 北京尚伦律师事务所 11477 | 代理人: | 张俊国 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 唤醒 选择 方法 装置 | ||
本发明是关于一种语音识别的唤醒词选择方法及装置,其中,方法包括:获取多个候选唤醒词;根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。通过该技术方案,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音识别的唤醒词选择方法及装置。
背景技术
目前,相关技术中可以通过语音对设备进行控制,设备不是实时录音并识别语音命令的,而是先识别是否收到唤醒词,如果收到唤醒词则激活,然后识别语音命令。唤醒效果的好坏依赖唤醒词的选择,唤醒词应具有较高的可区分性,从而能提高与非唤醒词语音以及环境音之间区分的正确性。
发明内容
本发明实施例提供一种语音识别的唤醒词选择方法及装置,用以选择可区分性高的唤醒词,从而提高唤醒词与非唤醒词以及环境音之间区分的正确性。
根据本发明实施例的第一方面,提供一种语音识别的唤醒词选择方法,包括:
获取多个候选唤醒词;
根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;
根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。
在该实施例中,在选择唤醒词时,根据唤醒词的发音计算每个候选唤醒词的可区分性得分,并根据可区分性得分确定目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
在一个实施例中,所述根据每个候选唤醒词的发音,计算出所述每个候选唤醒词对应的可区分性得分,包括:
将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;
根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分。
在该实施例中,可以通过唤醒词发音来判断其可区分性,进而选择目标唤醒词,从而提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
在一个实施例中,所述根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分,包括:
从所述每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;
根据所述发音不重复的单音素和预设计算公式,计算出所述每个候选唤醒词对应的可区分性得分,其中,所述预设计算公式包括:
其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示所述发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量所述目标单音素与其他单音素的发音区分性的函数,所述f(Pi)取值范围为[0,1]。
discriP(wuw)表示唤醒词wuw的区分性,其值越大代表该唤醒词的区分性越好。
在一个实施例中,所述根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词,包括:
将可区分性得分最高的候选唤醒词确定为目标唤醒词。
在该实施例中,在选择唤醒词时,根据每个候选唤醒词的发音计算每个候选唤醒词的可区分性得分,并从中选择可区分性得分最高的唤醒词为目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
在一个实施例中,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云知声信息技术有限公司,未经北京云知声信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611208275.X/2.html,转载请声明来源钻瓜专利网。