[发明专利]控制方法、智能设备和存储介质在审
申请号: | 202010265284.2 | 申请日: | 2020-04-07 |
公开(公告)号: | CN111477226A | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 胡新辉 | 申请(专利权)人: | 浙江同花顺智能科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L17/00;G10L17/02 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 金爱静 |
地址: | 310023 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 控制 方法 智能 设备 存储 介质 | ||
本申请涉及控制方法、智能设备和存储介质。该方法包括:从智能设备所处环境中采集得到第一音频数据,所述第一音频数据至少包含第一用户输入的携带有针对所述智能设备的控制指令的音频数据;将所述第一音频数据进行文本转换后,得到携带有所述控制指令的第一文本数据;获取所述第一音频数据的声纹特征信息,并与数据库中历史音频数据进行跟踪匹配,得到跟踪匹配结果;基于跟踪匹配结果确定是否运行所述第一文本数据所携带的控制指令。如此,为丰富使用场景,提高用户体验奠定了基础。
技术领域
本申请涉及智能控制领域,特别是涉及一种控制方法、智能设备和存储介质。
背景技术
现有语音控制智能设备的场景中,通常采用如下方式:先利用包含有指令头的语音来唤醒智能设备,然后,再利用包含有指令内容的语音来控制智能设备进行相应操作;显然,现有控制方式用户每次都需要输入指令头来唤醒智能设备,唤醒过程重复繁琐,而且,智能设备只要接收到包含有指令头的语音均会唤醒进而完成后续操作,对语音的用户来源不作区分和识别,因此,现有方式在某些场景下不适用,降低了用户体验。
发明内容
为解决上述问题,本发明提出了一种控制方法、智能设备和存储介质,能够利用声纹特征信息来实现音频来源的匹配和识别,进而为丰富应用场景,提高用户体验奠定了基础;同时,由于能够识别音频来源,所以解决了现有仅能利用指令头来唤醒智能设备后才能控制智能设备进行相应操作的问题,新增了一种智能设备的控制方式,进一步为丰富使用场景,提高用户体验奠定了基础。
第一方面,本申请实施例提供一种控制方法,包括:
从智能设备所处环境中采集得到第一音频数据,所述第一音频数据至少包含第一用户输入的携带有针对所述智能设备的控制指令的音频数据;
将所述第一音频数据进行文本转换后,得到携带有所述控制指令的第一文本数据;
获取所述第一音频数据的声纹特征信息,并与数据库中历史音频数据进行跟踪匹配,得到跟踪匹配结果,其中,所述跟踪匹配结果表征所述第一音频数据的声纹特征信息所对应的第一用户与历史音频数据所对应目标用户的匹配程度;所述数据库中历史音频数据至少包括目标用户基于携带有指令头的音频数据唤醒所述智能设备后,所述智能设备所采集到的携带有针对所述智能设备的控制指令的历史音频数据;
基于跟踪匹配结果确定是否运行所述第一文本数据所携带的控制指令。
本发明实施例中,所述获取所述第一音频数据的声纹特征信息,并与数据库中历史音频数据进行跟踪匹配,得到跟踪匹配结果,包括:
对所述第一音频数据进行分割处理,得到至少两个子数据;
基于子数据的声纹特征信息,对至少两个子数据进行聚类处理,得到第一用户对应的目标音频数据;所述目标音频数据为第一音频数据中的至少部分数据;
将目标音频数据的声纹特征信息与数据库中历史音频数据进行跟踪匹配,得到跟踪匹配结果。
本发明实施例中,所述方法还包括:
确定所述第一音频数据的声纹特征信息所对应的第一用户与历史音频数据所对应目标用户相匹配后,基于第一音频数据中第一用户的声纹特征信息,对所述智能设备所处环境的音频数据进行跟踪监测,以确定是否存在针对第一用户的其他音频数据。
本发明实施例中,所述方法还包括:
采集得到针对目标用户的第二音频数据,所述第二音频数据为目标用户输入的携带有针对所述智能设备的控制指令的音频数据;
获取所述第二音频数据的音频特征信息;
确定所述第二音频数据的音频特征信息满足预设音频规则后,将所述第二音频数据作为数据库中针对目标用户的历史音频数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江同花顺智能科技有限公司,未经浙江同花顺智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010265284.2/2.html,转载请声明来源钻瓜专利网。