[发明专利]语音交互方法及装置有效
申请号: | 201910636912.0 | 申请日: | 2014-01-20 |
公开(公告)号: | CN110459214B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 金洪波;江焯林 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L17/26 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 颜晶 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 方法 装置 | ||
本发明公开了一种语音交互方法及装置,属于语音处理技术领域。方法包括:获取用户的语音数据;对语音数据进行用户属性识别,得到第一用户属性识别结果;对语音数据进行内容识别,得到语音数据的内容识别结果;至少根据第一用户属性识别结果及内容识别结果执行相应操作,以响应语音数据。本发明在获取到语音数据后,分别对该语音数据进行用户属性识别及内容识别,得到第一用户属性识别结果及内容识别结果,且至少根据第一用户属性识别结果及内容识别结果执行相应操作,即便针对同一内容识别结果,由于不同用户的用户属性可能不同,所以执行的响应操作也可能不同,从而使得同一语音对应多种响应形式,丰富了语音响应方式,提高了语音响应的灵活性。
技术领域
本发明涉及语音处理技术领域,特别涉及一种语音交互方法及装置。
背景技术
随着信息技术的不断发展,用户交互技术得到了广泛的应用。而语音交互作为继键盘交互、鼠标交互及触摸屏交互后的新一代用户交互模式,以其方便快捷的特点,逐渐被广大用户认可且有被大规模推广的潜在前景。比如,智能移动终端上与语音相关的应用越来越多,而智能电视厂商也通过引用语音交互技术替换掉传统的手持遥控器。
现有技术中语音交互基于语音识别技术,也即,语音交互系统在接收到一段语音后,首先对语音数据进行内容识别,得到内容识别结果,并根据该内容识别结果获知用户意图。之后,语音交互系统根据用户意图进行与该语音相对应的操作,或向终端用户返回与该语音相对应的信息。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
由于现有技术中当语音内容一致时,语音交互系统执行的操作或返回的结果均一致,所以对语音内容的响应形式较为单一,灵活性不高。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种语音交互方法及装置。所述技术方案如下:
第一方面,提供了一种语音交互方法,所述方法包括:
获取用户的语音数据;
对所述语音数据进行用户属性识别,得到第一用户属性识别结果;
对所述语音数据进行内容识别,得到所述语音数据的内容识别结果;
至少根据所述第一用户属性识别结果及所述内容识别结果执行相应操作,以响应所述语音数据。
在第一方面的第一种可能的实现方式中,所述方法还包括:
采集用户图像;
当检测所述用户图像中的人数为预设值时,执行所述对所述语音数据进行用户属性识别的步骤。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述当检测所述用户图像中的人数为预设值之后,所述方法还包括:
提取所述用户图像中的人脸数据;
对所述人脸数据进行人脸识别,得到第二用户属性识别结果。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,所述至少根据所述第一用户属性识别结果及所述内容识别结果执行相应操作,包括:
将所述第一用户属性识别结果及所述第二用户属性识别结果进行加权,得到最终用户属性识别结果;
根据所述最终用户属性识别结果及所述内容识别结果执行相应操作。
结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,所述根据所述最终用户属性识别结果及所述内容识别结果执行相应操作,包括:
确定所述最终用户属性识别结果对应的词汇内容;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910636912.0/2.html,转载请声明来源钻瓜专利网。