[发明专利]一种文本编辑方法、装置、设备及可读存储介质在审
申请号: | 201810262255.3 | 申请日: | 2018-03-28 |
公开(公告)号: | CN110321534A | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | 占吉清;陈志刚;胡国平;胡郁 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F17/24 | 分类号: | G06F17/24;G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 230031 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 原始文本数据 目标命令 用户编辑 可读存储介质 语义 编辑操作 编辑命令 文本编辑 申请 文本编辑过程 准确度 人工操作 综合考虑 | ||
1.一种文本编辑方法,其特征在于,包括:
获取待编辑的原始文本数据及用户编辑命令;
确定所述用户编辑命令对应的编辑操作;
根据所述原始文本数据,与所述用户编辑命令所包含的各词的语义相关性,从所述用户编辑命令中确定目标命令词;
按照所述编辑操作,对所述原始文本数据中的所述目标命令词进行编辑。
2.根据权利要求1所述的方法,其特征在于,所述根据所述原始文本数据,与所述用户编辑命令所包含的各词的语义相关性,从所述用户编辑命令中确定目标命令词,包括:
根据所述用户编辑命令中每一词与所述原始文本数据的语义相关性,确定对应词的相关性特征;
利用预先训练的命令词确定模型,以及所述用户编辑命令中各词的相关性特征,从所述用户编辑命令包含的各词中确定目标命令词;
所述命令词确定模型预训练时的训练样本包括:与训练文本数据对应的用户编辑命令所包含训练词的词向量,及依据所述训练词与所述训练文本数据的语义相关性所确定的训练词的相关性特征;样本标签包括:所述训练词是否为目标命令词的标注结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述用户编辑命令中每一词与所述原始文本数据的语义相关性,确定对应词的相关性特征,包括:
对所述用户编辑命令及所述原始文本数据进行分词及词向量化,得到各自包含的分词的词向量;
分别确定所述用户编辑命令及所述原始文本数据各自包含的分词的i元词条,i取值[1,N],N为设定常数;
根据所述用户编辑命令包含的分词的i元词条,与所述原始文本数据中每个分词的i元词条的匹配情况,确定所述用户编辑命令包含的分词的相关性特征。
4.根据权利要求3所述的方法,其特征在于,所述根据所述用户编辑命令包含的分词的i元词条,与所述原始文本数据中每个分词的i元词条的匹配情况,确定所述用户编辑命令包含的分词的相关性特征,包括:
计算所述用户编辑命令包含的分词的i元词条,与所述原始文本数据中每个分词的i元词条的匹配得分;
根据所述匹配得分与设定匹配得分阈值的大小关系,确定所述用户编辑命令包括的分词的i元词条,在所述原始文本数据中的覆盖度;
根据所述匹配得分和/或所述覆盖度,确定所述用户编辑命令包含的分词的相关性特征。
5.根据权利要求2所述的方法,其特征在于,所述利用预先训练的命令词确定模型,以及所述用户编辑命令中各词的相关性特征,从所述用户编辑命令包含的各词中确定目标命令词,包括:
通过所述命令词确定模型的第一输入层,输入所述用户编辑命令中各词的词向量及相关性特征;
通过所述命令词确定模型的第一隐层集合,对各词的相关性特征进行变换,得到各词的变换后相关性特征;
通过所述命令词确定模型的输出层,根据所述各词的变换后相关性特征确定并输出所述用户编辑命令中的目标命令词。
6.根据权利要求5所述的方法,其特征在于,还包括:
通过所述命令词确定模型的第二输入层,输入所述原始文本数据中各词的词向量;
通过所述命令词确定模型的第二隐层集合,对所述原始文本数据中各词的词向量进行变换,得到各词的变换后词向量;
通过所述命令词确定模型的编码层,将预设用户编辑命令中第k个词对原始文本数据中每个词的关注度权重,乘以对应词的变换后词向量,得到第k个词对原始文本数据中各词的关注度权重向量,k取值[1-m],m为用户编辑命令包含的词总数;
通过所述命令词确定模型的编码层,将所述第k个词对原始文本数据中各词的关注度权重向量,与所述第一隐层集合输出的第k个词的变换后相关性特征相加,相加结果作为所述输出层的输入,以便所述输出层根据所述相加结果确定并输出所述用户编辑命令中的目标命令词。
7.根据权利要求1所述的方法,其特征在于,获取用户编辑命令的过程,包括:
获取语音形式的用户编辑命令,并转写为文本形式的用户编辑命令;
或,
获取文本形式的用户编辑命令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810262255.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种知识产权编码关键字系统
- 下一篇:儿童读物处理方法及装置