[发明专利]智能语音交互的方法、装置及计算机可读存储介质在审
申请号: | 201911219749.4 | 申请日: | 2019-12-03 |
公开(公告)号: | CN110931018A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 高宏;毛跃辉;王慧君 | 申请(专利权)人: | 珠海格力电器股份有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/22;G10L21/0232;G06F16/33;G06F40/30 |
代理公司: | 广州市时代知识产权代理事务所(普通合伙) 44438 | 代理人: | 陈旭燕 |
地址: | 519000*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 语音 交互 方法 装置 计算机 可读 存储 介质 | ||
本发明提供一种智能语音交互的方法。所述智能语音交互的方法包括:获取待识别的语音信号;利用识别模型识别所述语音信号并输出第一语义文本;将所述语音信号与预设的用户语料库进行匹配,确定所述语音信号对应的用户语料库并输出第二语义文本;根据所述第一语义文本和所述第二语义文本确定所述语音信号对应的目标语义文本及所述目标语义文本对应的控制指令。本发明结合预设的用户语料库和识别模型分别输出的第一语义文本、第二语义文本,并在此基础上进一步确定所述语音信号的目标语义文本,保证了语音控制的准确性,给用户带来更好的控制体验。
技术领域
本发明涉及语音交互技术领域,具体而言,涉及一种智能语音交互的方法、装置及计算机可读存储介质。
背景技术
随着人工智能技术的日益成熟,人们的生活开始走向智能化,各种智能设备逐渐进入人们的日常生活中。语音交互作为智能设备应用中主流的交互方式之一,其交互的方式通常只考虑机器的对语音的翻译识别结果,并未考虑到用户语料库,即用户表达的多样化,对于用户的交互语音可能会做出错误的理解,从而导致智能交互设备做出错误的响应,带来较差的用户体验。
因此,业内亟需一种能解决上述问题的技术方案。
发明内容
本发明提供了一种智能语音交互的方法,以提高语音交互控制的准确性,给用户带来更好的控制体验。
对应地,本发明提供了一种智能语音交互的装置及一种计算机可读存储介质。
本发明具体采用如下技术方案:
第一方面,本发明提供了一种智能语音交互的方法。
所述智能语音交互的方法包括:
获取待识别的语音信号;
利用识别模型识别所述语音信号并输出第一语义文本;
将所述语音信号与预设的用户语料库进行匹配,确定所述语音信号对应的用户语料库并输出第二语义文本;
根据所述第一语义文本和所述第二语义文本确定所述语音信号对应的目标语义文本及所述目标语义文本对应的控制指令。
具体地,所述利用识别模型识别所述语音信号并输出第一语义文本的步骤之前,还包括:
对所述语音信号预处理去噪。
具体地,所述对所述语音信号预处理去噪的步骤中,具体包括:
对所述语音信号进行频谱分析;
将所述频谱分析后的语音信号按照预设的规则过滤去噪。
具体地,所述将所述语音信号与预设的用户语料库进行匹配的步骤中,具体包括:
提取所述语音信号的声纹特征,根据所述声纹特征匹配所述语音信号对应的用户语料库。
进一步地,所述用户语料库具有多个,一个所述用户语料库对应一个所述声纹特征。
具体地,所述根据所述第一语义文本和所述第二语义文本确定所述语音信号对应的目标语义文本的步骤中,具体包括:
确定所述第一语义文本和所述第二语义文本所对应的概率系数,分别对所述第一语义文本和所述第二语义文本根据所述概率系数加权计算,得到计算后的目标语义文本。
进一步地,还包括:
根据所述目标语义文本更新所述用户语料库。
具体地,所述用户语料库包括通用的用户语料库和特定的用户语料库;所述将所述语音信号与预设的用户语料库进行匹配的步骤中,具体包括:
提取所述语音信号的声纹特征,通过声纹模型进行匹配;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海格力电器股份有限公司,未经珠海格力电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911219749.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种纺织加工用导带机
- 下一篇:一种基于超声信号及力学信号的在机测厚系统