[发明专利]语音输入方法和终端设备在审
申请号: | 201511032340.3 | 申请日: | 2015-12-31 |
公开(公告)号: | CN106933561A | 公开(公告)日: | 2017-07-07 |
发明(设计)人: | 李利平;王苏杭;严从现;杨磊;刘敏;赵虹;姚佳 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F9/44 | 分类号: | G06F9/44;G06F3/16;G06F17/27 |
代理公司: | 北京华沛德权律师事务所11302 | 代理人: | 马苗苗 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 输入 方法 终端设备 | ||
1.一种语音输入方法,其特征在于,该方法包括:
在语音输入模式下,接收用户输入的第一语音并识别生成第一识别结果,根据所述第一识别结果向用户展现相应的文字内容;
在编辑模式下,接收用户输入的第二语音并识别生成第二识别结果;将所述第二识别结果转换为编辑指令,根据所述编辑指令执行相应操作;
所述语音输入模式和编辑模式之间能相互切换。
2.根据权利要求1所述的方法,其特征在于,所述步骤:将所述第二识别结果转换为编辑指令,具体包括:将所述第二识别结果与预先存储的操作信息模型进行匹配,根据所述匹配结果确定编辑指令的类型。
3.根据权利要求2所述的方法,其特征在于,所述步骤:根据所述编辑指令执行相应操作,至少包括以下一个步骤:
如果根据所述匹配结果确定编辑指令的类型为命令,则直接执行所述命令;
如果根据所述匹配结果确定编辑指令的类型为纠错,则根据所述第二识别结果,对展现的文字内容进行纠错操作;
如果根据所述匹配结果确定编辑指令的类型为添加内容元素,则根据所述第二识别结果推送相应的内容元素。
4.根据权利要求4所述的方法,其特征在于,所述命令包括删除、换行、回车、清空、发送、撤销中的至少一个。
5.根据权利要求3或4所述的方法,其特征还在于,所述步骤:如果根据所述匹配结果确定编辑指令的类型为纠错,则根据所述第二识别结果,对展现的文字内容进行纠错操作,具体包括:
对所述第二识别结果进行语义分析,根据语义分析结果确定对应的纠错操作类型以及待纠错部分;
对所述待纠错的部分按照所述纠错操作类型进行纠错。
6.根据权利要求5所述的方法,其特征还在于,所述步骤:对所述待纠错的部分按照所述纠错操作类型进行纠错,具体包括:根据待纠错部分的上下文确定纠错后的内容,对待纠错的部分进行更正。
7.根据权利要求3或4所述的方法,其特征还在于,所述步骤:根据所述第二识别结果,对所述展现的文字内容进行纠错操作,具体包括:
对所述第二识别结果进行语义分析,根据语义分析结果确定对应的纠错操作类型以及纠错后的内容;
按照所述纠错操作类型、纠错后的内容对所述展现的文字内容进行纠错。
8.根据权利要求7的方法,其特征还在于,所述纠错操作类型为替换;所述步骤:按照所述纠错操作类型、纠错后的内容对所述展现的文字内容进行纠错,具体为:对拼音相同或相近的文字进行替换。
9.根据权利要求8所述的方法,其特征还在于,所述第二语音包括替换字词的结构信息或者语义信息。
10.根据权利要求1-9任一项所述的方法,其特征还在于,所述步骤:如果根据所述匹配结果确定编辑指令的类型为添加内容元素,根据所述第二识别结果推送相应的内容元素,具体包括:
将所述第二识别结果与预存的颜文字、图片、文本、动画、应用、音频、视频中的至少一项的标识信息和/或属性信息进行匹配;
向用户展现相匹配的颜文字、图片、文本、动画、应用、音频、视频中的至少一项。
11.根据权利要求1-10任一项所述的方法,其特征在于,在所述编辑模式下,基于用户习惯或对侧用户习惯向用户推荐颜文字、图片、文本、动画、应用、音频、视频中的至少一项。
12.根据权利要求10或11所述的方法,所述图片包括静态图片。
13.根据权利要求1-12任一项所述的方法,其特征还在于,该方法还包括:由语音输入模式切换至编辑模式后,提供编辑指令和/或输入内容提示信息。
14.一种终端设备,其特征在于,该设备包括:
语音输入单元,用于在语音输入模式下,接收用户输入的第一语音,在编辑模式下接收用户输入的第二语音;
语音识别单元,用于分别对所述第一语音、第二语音进行识别,分别生成第一识别结果、第二识别结果;
显示单元,用于根据第一识别结果向用户展现相应的文字内容;
编辑操作处理单元,用于在编辑模式下将所述第二识别结果转换为编辑指令,并根据所述编辑指令执行相应操作;所述语音输入模式和编辑模式之间能相互切换。
15.一种用于语音输入的装置,其特征在于,包括有存储器,以及一个或 者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
在语音输入模式下,接收用户输入的第一语音并识别生成第一识别结果,根据所述第一识别结果向用户展现相应的文字内容;
在编辑模式下,接收用户输入的第二语音并识别生成第二识别结果;将所述第二识别结果转换为编辑指令,根据所述编辑指令执行相应操作;
所述语音输入模式和编辑模式之间能相互切换。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511032340.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电梯夹轨器
- 下一篇:液力阻尼摩擦电梯防坠落装置