[发明专利]一种语音交互方法、装置、设备及计算机可读存储介质在审
申请号: | 201910806670.5 | 申请日: | 2019-08-29 |
公开(公告)号: | CN112447179A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 马建华;李青懋 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团有限公司 |
主分类号: | G10L17/22 | 分类号: | G10L17/22;G10L17/06;G10L15/26;G10L15/18;G06F40/35;H04R3/00 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;刘伟 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 交互 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明公开了一种语音交互方法、装置、设备及计算机可读存储介质,涉及通信技术领域,以解决具有音箱功能的终端无法在特定场景满足用户高效沟通的需求的问题。该方法包括:接收消息发送方的语音消息;根据所述语音消息,识别所述消息发送方的身份信息;根据所述消息发送方的身份信息、所述语音消息以及预设的用户关系图谱,确定消息接收方;向所述消息接收方输出所述语音消息。本发明实施例可使得用户可利用具有音箱功能的终端进行高效的沟通。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种语音交互方法、装置、设备及计算机可读存储介质。
背景技术
智能音箱基于人工智能的人机对话,通过语音输入、语义识别、指令执行等,构建闭环的家庭、办公等场景下的智能生态圈。当前智能音箱的主要功能集中在高音质的播放、智能电话、家居控制、声纹识别个性化爱好定制、日常的人机对话查询等功能。但是,目前智能音箱仅作为声音输入-输出的通道,在一些特定的应用场景下,比如人际交互场景中,无法满足用户高效沟通的需求。
发明内容
本发明实施例提供一种语音交互方法、装置、设备及计算机可读存储介质,以解决具有音箱功能的终端无法在特定场景满足用户高效沟通的需求的问题。
第一方面,本发明实施例提供了一种语音交互方法,应用于具有音箱功能的终端,包括:
接收消息发送方的语音消息;
根据所述语音消息,识别所述消息发送方的身份信息;
根据所述消息发送方的身份信息、所述语音消息以及预设的用户关系图谱,确定消息接收方;
向所述消息接收方输出所述语音消息。
其中,所述根据所述语音消息,识别所述消息发送方的身份信息,包括:
提取所述语音消息的声纹特征;
根据所述声纹特征和第一对应关系,识别所述消息发送方的身份信息,其中,所述第一对应关系为声音模型与用户身份之间的对应关系。
其中,所述根据所述语音消息,识别所述消息发送方的身份信息,包括:
获取所述消息发送方发送所述语音消息所使用的终端的信息;
提取所述语音消息的声纹特征;
根据所述声纹特征、所述终端的信息和第二对应关系,识别所述消息发送方的身份信息,其中,所述第二对应关系为声音模型、终端信息与用户身份之间的对应关系。
其中,所述根据所述消息发送方的身份信息、所述语音消息以及预设的用户关系图谱,确定消息接收方,包括:
将所述语音消息转换为文字消息;
基于NLP(Natural Language Processing,自然语言处理)算法,对所述文字消息进行语义识别,获得语义识别结果;
根据所述消息发送方的身份信息、所述语义识别结果以及所述用户关系图谱,确定消息接收方。
其中,所述向所述消息接收方输出所述语音消息,包括:
获取所述消息接收方的声音模型;
将所述语音消息和所述声音模型进行合成,得到合成后的语音消息;
利用所述音箱向所述消息接收方广播所述合成后的语音消息。
其中,在所述得到合成后的语音消息之后,所述方法还包括:
缓存所述合成后的语音消息。
其中,在所述接收消息发送方的语音消息之前,所述方法还包括以下至少一项:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团有限公司,未经中国移动通信有限公司研究院;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910806670.5/2.html,转载请声明来源钻瓜专利网。