[发明专利]基于语音识别的数据传输方法和装置有效
申请号: | 201710047882.0 | 申请日: | 2017-01-22 |
公开(公告)号: | CN108346429B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 林剑城 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/04;H04M1/72439;H04M1/72469 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 何平;邓云鹏 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 识别 数据传输 方法 装置 | ||
1.一种基于语音识别的数据传输方法,其特征在于,所述方法由终端执行,所述方法包括:
当进入语音输入界面时,向服务器发送建立数据传输通道的请求,在接收到所述服务器反馈的应答消息后,与所述服务器之间建立基于传输控制协议的数据传输通道;
定期检测所述数据传输通道是否处于空闲状态;
当检测到所述数据传输通道处于空闲状态时,通过所述数据传输通道发送心跳数据包;
若在预设时长内未接收到通过所述数据传输通道传来的针对所述心跳数据包的应答包,则关闭所述数据传输通道,重新建立数据传输通道并保持;
依次获取输入的语音片段,每个所述语音片段是用户在进行语音输入时,人为分次输入的语音数据;通过所述数据传输通道,依次发送所述语音片段;
通过所述数据传输通道,接收与发送的所述语音片段匹配的语音识别结果;
当退出所述语音输入界面时,关闭所述数据传输通道。
2.根据权利要求1所述的方法,其特征在于,所述进入语音输入界面的步骤包括:
显示语音输入界面的开启入口;
获取针对所述开启入口的开启指令;
根据所述开启指令,展示语音输入界面。
3.根据权利要求2所述的方法,其特征在于,所述退出所述语音输入界面的步骤包括:
获取针对所述语音输入界面的界面隐藏指令;
根据所述界面隐藏指令隐藏所述语音输入界面。
4.根据权利要求2所述的方法,其特征在于,所述通过所述数据传输通道,接收与发送的所述语音片段匹配的语音识别结果之后,所述方法还包括:
在所述语音输入界面输出所述语音识别结果;
当检测到针对输出的所述语音识别结果的取消操作时,撤销输出的所述语音识别结果;
当检测到针对输出的所述语音识别结果的确认输入操作时,根据输出的所述语音识别结果进行文本录入操作。
5.根据权利要求1所述的方法,其特征在于,所述通过所述数据传输通道,依次发送所述语音片段的步骤包括:
通过所述数据传输通道,依次向所述数据传输通道所连接至的服务器发送所述语音片段,使得所述服务器在接收到发送的所述语音片段后,根据已接收到的多个语音片段进行语音识别,得到与发送的所述语音片段匹配的语音识别结果。
6.根据权利要求5所述的方法,其特征在于,所述通过所述数据传输通道,接收与发送的所述语音片段匹配的语音识别结果的步骤包括:
在通过所述数据传输通道发送语音片段时,通过所述数据传输通道并行接收所述服务器反馈的与发送的所述语音片段匹配的语音识别结果。
7.根据权利要求1至4中任一项所述的方法,其特征在于,所述通过所述数据传输通道,接收与发送的所述语音片段匹配的语音识别结果包括:
通过所述数据传输通道,接收按照应用层协议封装的数据包;
解析所述数据包,得到所述数据包中封装的加密的语音识别结果;
将加密的语音识别结果解密,得到与发送的所述语音片段匹配的语音识别结果。
8.根据权利要求1至6中任一项所述的方法,其特征在于,所述方法还包括:
在每次通过所述数据传输通道发送所述语音片段时,和/或,在每次通过所述数据传输通道接收所述语音识别结果时,则
检测所述数据传输通道是否异常;
当所述数据传输通道异常时,则
关闭所述数据传输通道,重新建立数据传输通道并保持;
通过重新建立的所述数据传输通道,继续发送当次需发送的所述语音片段和/或接收当次需接收的所述语音识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710047882.0/1.html,转载请声明来源钻瓜专利网。