[发明专利]文本编辑方法及装置在审
申请号: | 201710702071.X | 申请日: | 2017-08-16 |
公开(公告)号: | CN107480118A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 占吉清;陈志刚;胡国平;胡郁 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F17/24 | 分类号: | G06F17/24;G06F17/27;G06K9/62 |
代理公司: | 北京维澳专利代理有限公司11252 | 代理人: | 赵景平,胡湘根 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本编辑 方法 装置 | ||
技术领域
本发明涉及语音信号处理领域,具体涉及一种文本编辑方法及装置。
背景技术
文本编辑主要是指对文字进行一些字体格式、排版处理、错误修改等,在现有技术中,一般是由人工利用键盘和鼠标来完成,首先将光标对待编辑文本在原始文本中的位置进行定位,然后对原始文本中相应文本进行编辑。比如,对于文本数据“今天蓝鲸的天气很好,我打算去那玩几天。”,需要将其中的“蓝鲸”改成“南京”,另外还要将“南京”加粗,将“天气”加下划线”等。
这种编辑方法需要人工操作,当需要编辑的原始文本较多时,编辑效率较低,而且容易出错,人工成本较高。
发明内容
本发明提供一种文本编辑方法及装置,以解决现有的文本编辑存在的效率低、成本高的问题。
为此,本发明提供如下技术方案:
一种文本编辑方法,包括:
获取待编辑的原始文本;
接收用户编辑语音数据;
对所述用户编辑语音数据进行语音识别,得到编辑命令;
对所述编辑命令进行语义理解,以确定当前待编辑文本及编辑状态的取值;所述编辑状态用于描述是否能确定所述当前待编辑文本在原始文本中的位置;
根据所述当前待编辑文本及编辑状态的取值确定是否可以执行所述编辑命令;
如果是,则根据所述编辑命令对所述原始文本进行编辑;
否则,与用户交互,以获取更多对应所述当前待编辑文本的编辑状态的取值。
优选地,所述方法还包括:预先设定语义槽的类型;
所述对所述编辑命令进行语义理解,以确定当前待编辑文本及编辑状态包括:
对所述编辑命令进行语义理解,确定所述编辑命令包含的语义槽及其类型;
根据所述编辑命令包含的语义槽及其类型确定当前待编辑文本及编辑状态。
优选地,所述语义槽的类型包括用于描述用户编辑状态的语义槽、用于描述用户编辑操作的语义槽、以及用于描述编辑文本的语义槽;
所述用于描述用户编辑状态的语义槽包括以下任意一种或多种:
顺序语义槽,所述顺序语义槽用于描述待编辑文本在原始文本中的顺序;
类型语义槽,所述类型语义槽用于描述待编辑文本的类型;
汉字结构语义槽,所述汉字结构语义槽用于描述待编辑文本的汉字结构;
偏旁部首语义槽,所述偏旁部首语义槽用于描述待编辑文本的偏旁部首;
汉字描述语义槽,所述汉字描述语义槽用于对待编辑文本进行限定;
参考语义槽,所述参考语义槽用于描述待编辑文本在原始文本中的参考文本;
全局位置语义槽,所述全局语义槽指待编辑文本在原始文本中的全局位置;
相对位置语义槽,所述相对位置语义槽指待编辑文本在原始文本中的相对位置;
所述用于描述用户编辑操作的语义槽包括以下任意一种或多种:添加语义槽、删除语义槽、修改语义槽、修改字体大小语义槽、修改字体颜色语义槽、修改字体粗细语义槽、换行语义槽、缩进语义槽;
所述用于描述编辑文本的语义槽包括:待编辑语义槽、编辑后语义槽。
优选地,所述方法还包括:
预先构建语义槽提取模型;
所述对所述编辑命令进行语义理解,确定所述编辑命令包含的语义槽及其类型包括:
将所述编辑命令中的每个词进行向量化后作为语义槽提取特征;
将所述语义槽提取特征输入所述语义槽提取模型,根据所述语义槽提取模型的输出得到所述编辑命令包含的语义槽及其类型。
优选地,按以下方式构建语义槽提取模型:
设定编辑命令模板,所述编辑命令模板包含一个或多个语义槽,每个语义槽有确定的类型;
收集大量用于填充所述语义槽的填充文本;
将所述填充文本填充到所述语义槽中,得到大量编辑命令数据并将其作为训练数据,标注所述训练数据中每个词是否为语义槽及语义槽的类型;
对所述训练数据进行分词,并获取每个词的词向量;
根据所述词向量及标注信息训练得到语义槽提取模型。
优选地,所述方法还包括:
预先构建文本编辑文法库,所述文本编辑文法库包括多个文法模板;
所述对所述编辑命令进行语义理解,确定所述编辑命令包含的语义槽及其类型包括:
将所述编辑命令与所述文本编辑文法库中各文法模板进行匹配,根据匹配结果确定所述编辑命令包含的语义槽及其类型。
优选地,按以下方式构建文本编辑文法库:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710702071.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自动化页面表单数据的恢复方法及装置
- 下一篇:一种报表模板生成方法和装置