[发明专利]一种语音控制的方法及装置有效
申请号: | 202010377176.4 | 申请日: | 2018-05-14 |
公开(公告)号: | CN111627436B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 李鹏;罗永浩 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 泰和泰律师事务所 51219 | 代理人: | 祝海燕 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 控制 方法 装置 | ||
本申请实施例公开了一种语音控制的方法及装置,该方法包括:终端可以响应于针对于交互界面的触发操作,接收语音数据,其中,该语触发操作为客户端在交互界面上所识别的触发语音控制的操作,然后,终端可以将接收到的语音数据转换为文本数据,并根据该文本数据生成与操作该应用的控制指令并执行,从而实现用户与应用的交互。可见,在用户与客户端进行交互的过程中,用户可以直接在交互界面上的任意区域触发语音数据的输入,而无需受限于特定的语音输入界面,因此,用户不需要再执行相关操作以使得终端的显示界面由交互界面切换到语音输入界面,从而减少了用户所需执行的操作步骤,提高了用户与客户端之间的交互效率,也提高了用户的使用体验。
本申请是名称为:一种语音控制的方法及装置,申请号为:201810456387.X的发明专利的分案申请,母案申请日为2018年05月14日。
技术领域
本申请涉及语音控制技术领域,具体涉及一种语音控制的方法及装置。
背景技术
随着技术的发展,通过语音来与智能终端上应用进行交互的方式,越来越受用户青睐。现有的语音交互过程中,用户通过点击语音控制服务的控件来启动语音控制服务,此时,智能终端会向用户呈现一个语音输入界面,然后,用户在该语音输入界面上进行发声以输入语音数据,以使得智能终端根据用户输入的语音数据操作相应的应用,从而实现用户与智能终端上应用的各种交互。
但是,每次用户与应用进行交互时,智能终端都需要预先向用户呈现语音输入界面,然后才能与用户实现语音交互,从而导致智能终端无法快速的与用户进行语音交互,用户的使用体验较差。
发明内容
有鉴于此,本申请实施例提供一种语音控制的方法及装置,以提高用户与智能终端进行语音交互的效率。
为解决上述问题,本申请实施例提供的技术方案如下:
第一方面,本申请实施例提供了一种语音控制的方法,该方法包括:
响应于针对于交互界面的触发操作,接收语音数据,所述触发操作为客户端在所述交界面上所识别的触发语音控制的操作;
将所述语音数据转换为文本数据;
基于所述文本数据,生成控制指令;
执行所述控制指令。
在一些可能的实施方式中,所述将所述语音数据转换为文本数据,包括:
将所述语音数据转换为初始文本数据;
通过对所述初始文本数据进行语义分析,调整所述初始文本数据,将所述调整后的初始文本数据作为所述文本数据。
在一些可能的实施方式中,所述基于所述文本数据,生成控制指令,包括:
将所述文本数据与预设的指令型文本数据进行匹配,并基于匹配到的指令型文本数据生成控制指令。
在一些可能的实施方式中,所述方法还包括:
通过对所述初始文本数据进行语义分析,确定所述调整后的初始文本数据中的动作关键词和/或对象关键词。
在一些可能的实施方式中,所述文本数据包括动作关键词和对象关键词,则所述将所述文本数据与预设的指令型文本数据进行匹配,并基于匹配到的指令型文本数据生成控制指令,包括:
将所述文本数据中的动作关键词,与所述预设的指令型文本数据中的动作关键词进行匹配,确定第一动作关键词,所述第一动作关键词是指在所述预设的指令型文本数据中所匹配到的动作关键词;
将所述文本数据中的对象关键词,与所述预设的指令型文本数据中的对象关键词进行匹配,确定第一对象关键词,所述第一对象关键词是指在所述预设的指令型文本数据中所匹配到的对象关键词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010377176.4/2.html,转载请声明来源钻瓜专利网。