[发明专利]一种交互方法和设备在审
申请号: | 201711092757.8 | 申请日: | 2017-11-08 |
公开(公告)号: | CN109767774A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 吴楠;雷鸣 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/24 | 分类号: | G10L15/24;G10L15/26;G10L17/22 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;徐焕 |
地址: | 英属开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 唤醒 交互设备 方法和设备 语音交互 语音数据 技术效果 语音设备 发声 远场 申请 | ||
本申请提供了一种交互方法和设备,其中,该方法包括:识别是否有对象面对交互设备且处于发声状态;在确定有对象面对所述交互设备且处于发生状态的情况下,获取所述对象的语音数据;根据所述语音数据建立所述对象与所述交互设备之间的交互。通过上述方式解决了现有的语音交互需要为语音设备设置唤醒词,通过唤醒词进行唤醒所存在的唤醒词数量少,且容易误唤醒的技术问题,达到了无需唤醒词即可实现远场语音交互的技术效果。
技术领域
本申请属于数据处理技术领域,尤其涉及一种交互方法和设备。
背景技术
随着语音识别技术的不断发展,越来越多的语音智能设备被研发和使用。目前语音交互方式主要有:远程语音交互方式和近场的手动触发方式。
其中,远程语音交互方式一般是通过唤醒词唤醒设备,从而使得可以被唤醒的设备进行语音交互。例如,如图1所示,可以为某个设备设置一个唤醒词为“Miu miu”,那么当用户说出“Miu miu”并被该设备识别的时候,该设备就会被唤醒,从而使得用户可以与该设备进行语音交互,这这个过程中,不需要用户手动进行操作。
其中,手动触发方式一般是在设备上设置一个按钮或者是触发按键,在用户点击该按钮或者按键的情况下,可以触发该设备开启语音交互功能,从而使得用户可以与该设备进行语音交互。
然而,上述的远程语音交互方式和近场的手动触发方式都存在不同程度的问题,例如,远程语音容易受到环境噪音的干扰,会出现误唤醒。近场的手动触发方式每次都需要手动触发,因此操作不便,需要用户靠近设备才能操作,使用起来较为麻烦。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本申请目的在于提供一种交互方法和设备,可以实现无需唤醒词进行设备唤醒即可进行语音交互的目的。
本申请提供一种交互方法和设备是这样实现的:
一种交互方法,所述方法包括:
识别是否有对象面对交互设备且处于发声状态;
在确定有对象面对所述交互设备且处于发生状态的情况下,获取所述对象的语音数据;
根据所述语音数据建立所述对象与所述交互设备之间的交互。
一种交互方法,所述方法包括:
识别是否有对象面对交互设备;
在确定有对象面对所述交互设备且停留时长超出预设时长的情况下,建立所述对象与所述交互设备之间的交互。
一种交互方法,所述方法包括:
识别是否有对象面对交互设备;
在确定有对象面对所述交互设备的情况下,建立所述对象与所述交互设备之间的交互。
一种交互设备,包括:摄像头、麦克风阵列、处理器,其中,
所述摄像头,用于获取图像;
所述处理器,用于根据所述图像识别是否有对象面对交互设备且处于发声状态;
所述麦克风阵列,用于在确定有对象面对所述交互设备且处于发声状态的情况下,获取所述对象的语音数据;
所述处理器,用于根据所述语音数据建立所述对象与所述交互设备之间的交互。
一种交互设备,包括:摄像头、麦克风阵列、处理器,其中,
所述摄像头,用于获取图像;
所述处理器,用于根据所述图像识别是否有对象面对交互设备且停留时长超出预设时长;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711092757.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于语音交互终端的信息输出方法和装置
- 下一篇:语音控制方法、装置和空调