[发明专利]语音交互方法、装置、设备及存储介质在审
申请号: | 201910196765.X | 申请日: | 2019-03-15 |
公开(公告)号: | CN111768769A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 曹元斌;张智超;徐涛 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/04;G10L15/28;G10L17/22;G10L17/00 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 屠长存 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 方法 装置 设备 存储 介质 | ||
本公开提出了一种语音交互方法、装置、设备及存储介质。针对接收到的第一语音进行唤醒检测;在唤醒成功的情况下,获取第一语音的第一声纹特征;接收第一语音之后的第二语音;确定第二语音中与第一声纹特征相匹配的语音部分的语音识别结果;基于语音识别结果,为用户提供服务。由此可以解决因不能区分说话人,而导致的语音识别错误的问题。
技术领域
本公开涉及语音交互领域,特别是涉及一种语音交互方法、装置、设备及存储介质。
背景技术
语音交互属于人机交互的范畴,是人机交互发展到现在的一种较为前沿的交互方式。语音交互就是用户通过自然语言给机器下指令,以达成自己的目的的过程。
目前的语音交互方案主要是利用ASR(Automatic Speech Recognition,自动语音识别)技术从语音输入的频谱抽出来的特征,来识别出文本内容。在语音交互过程中不能区分语音的来源,因此,如果语音交互过程中除了使用者外,附近有其他人说话,则会导致语音识别错误,降低用户的体验。
例如,在智能音箱这一语音场景下,不同于手机端,音箱会接收来自四面八方所有使用人的语音信号,于是在智能音箱的场景下,当使用者对音箱下命令的同时,如果有其他人也在进行说话,则会导致语音识别错误,带来不好的用户体验。
因此,需要一种能够提高语音识别的准确度的语音交互方案。
发明内容
本公开的一个目的在于提供一种能够提高语音识别的准确度的语音交互方案。
根据本公开的第一个方面,提出了一种语音交互方法,包括:针对接收到的第一语音进行唤醒检测;在唤醒成功的情况下,获取第一语音的第一声纹特征;接收第一语音输入之后的第二语音;确定第二语音中与第一声纹特征相匹配的语音输入部分的语音识别结果;基于语音识别结果,为用户提供服务。
可选地,确定第二语音中与第一声纹特征相匹配的语音部分的语音识别结果的步骤包括:识别第二语音的文本内容;获取文本内容中各个字或词对应的第二语音中的语音片段的第二声纹特征;确定第二声纹特征与第一声纹特征的相似度大于预定阈值的语音片段;基于所确定的语音片段所对应的字或词,得到语音识别结果。
可选地,该方法还包括:去除所述第二语音中与所述第一声纹特征不匹配的语音部分的语音识别结果。
可选地,所述去除所述第二语音中与所述第一声纹特征不匹配的语音部分的语音识别结果的步骤包括:识别所述第二语音的文本内容;获取所述文本内容中各个字或词对应的所述第二语音中的语音片段的第二声纹特征;去除所述第二声纹特征与所述第一声纹特征的相似度小于预定阈值的语音片段所对应的字或词。
可选地,第一声纹特征为第一语音中与唤醒词对应的语音部分的声纹特征。
可选地,该方法还包括:将第一声纹特征与声纹特征库中的声学特征进行比较,其中,声纹特征库中的声学特征为已注册用户的声学特征;在声纹特征库中不存在与第一声纹特征相匹配的声学特征的情况下,将第一声纹特征注册为新用户,并将第一声纹特征保存到声纹特征库中。
根据本公开的第二个方面,还提出了一种语音交互方法,包括:针对接收到的语音进行唤醒检测;在唤醒成功的情况下,获取语音中与唤醒词对应的第一语音部分的第一声纹特征;确定语音中与第一声纹特征相匹配的第二语音部分的语音识别结果;基于语音识别结果,为用户提供服务。
可选地,确定语音中与第一声纹特征相匹配的第二语音部分的语音识别结果的步骤包括:识别语音部分的文本内容;获取文本内容中各个字或词对应的语音中的语音片段的第二声纹特征;确定第二声纹特征与第一声纹特征的相似度大于预定阈值的语音片段;基于所确定的语音片段所对应的字或词,得到语音识别结果。
可选地,该方法还包括:去除所述语音中与所述第一声纹特征不匹配的第三语音部分的语音识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910196765.X/2.html,转载请声明来源钻瓜专利网。