[发明专利]人机交互方法、装置、计算机设备和存储介质在审
申请号: | 202010400842.1 | 申请日: | 2020-05-13 |
公开(公告)号: | CN111752523A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 陈百灵 | 申请(专利权)人: | 深圳追一科技有限公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16;G06F40/30;G10L15/22;G10L15/18;G10L17/22 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 唐彩琴 |
地址: | 518051 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人机交互 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种人机交互方法、装置、计算机设备和存储介质,电话机器人在播放目标语音数据时检测目标用户所在环境中的语音信息,若该语音信息为目标用户的语音信息,则暂停播放目标语音数据,并记录目标语音数据在暂停时刻的播放位置,然后识别目标用户的语音信息的语义,执行与语义对应的响应操作,且在响应操作结束后,从暂停时刻的播放位置,播放目标语音数据剩余的内容。该方法可以避免了因用户的打断造成语音重复播报导致的效率低下和信息传达不完整,提升了机器人灵活应对用户的打断,使得人机交互效率更高,更加灵活、智能。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种人工交互方法、装置、计算机设备和存储介质。
背景技术
随着人工智能技术的发展,智能机器人已经在各领域得到了应用,例如,在电信运营商、金融服务、电子政务、电子商务、各类智能终端及个人互联网信息服务等诸多领域提供了自动客服、智能营销、内容导航、智能语音控制、娱乐聊天等多种类型的服务。
大部分智能机器人在服务的过程中,可以与用户进行基本交流,但当机器人在播放话术的时候,如果所在环境中噪音很大,例如用户周围的环境中的他人说话等噪音,就会造成机器人的讲话被错误的打断;或者机器人在用户多次连续打断后,会机械地从头重新播放话术。
因此,现有的机器人存在人机交互不够灵活,不够智能的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够使人机交互更加灵活、智能的人机交互方法、装置、计算机设备和存储介质。
第一方面,提供一种人机交互方法,该方法包括:
在播放目标语音数据时检测目标用户所在环境中的语音信息;
若语音信息为目标用户的语音信息,暂停播放目标语音数据,并记录目标语音数据在暂停时刻的播放位置;
识别目标用户的语音信息的语义,执行与语义对应的响应操作;
在响应操作结束后,从暂停时刻的播放位置,播放目标语音数据剩余的内容。
在其中一个实施例中,上述识别目标用户的语音信息的语义,执行与语义对应的响应操作,包括:
根据目标用户的语音信息的语义,确定语音信息的信息类型;
根据信息类型,执行与语义对应的响应操作。
在其中一个实施例中,上述根据信息类型,执行与语义对应的响应操作,包括:若信息类型为询问式类型,从预设的知识库中匹配与目标用户的语音信息的语义对应的回复内容,并播放回复内容;知识库中包括多种信息类型对应的回复内容;或者,
若信息类型为附和式类型,停顿预设时长后继续从暂停时刻的播放位置,播放目标语音数据剩余的内容。
在其中一个实施例中,上述记录目标语音数据在暂停时刻的播放位置,包括:
确定目标语音数据中暂停时刻对应的分句;
将暂停时刻对应的分句在目标语音数据中的位置,确定为目标语音数据在暂停时刻的播放位置。
在其中一个实施例中,上述在播放目标语音数据时检测目标用户所在环境中的语音信息之后,该方法包括:
若语音信息为非目标用户的语音信息,对语音信息不作响应,继续播放目标语音数据。
在其中一个实施例中,该方法还包括:
通过预设的声音特征检测模型识别目标用户所在环境中的语音信息是否为目标用户的语音信息。
在其中一个实施例中,上述声音特征检测模型的训练过程包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010400842.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动跟踪人脸的摄像头转动控制方法
- 下一篇:一种多功能数据库维护管理系统