[发明专利]一种可编辑的云词库的解析方法有效
申请号: | 201810676453.4 | 申请日: | 2018-06-27 |
公开(公告)号: | CN109033183B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 谭锦钿;毛小兰;林楠 | 申请(专利权)人: | 清远墨墨教育科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 广州圣理华知识产权代理有限公司 44302 | 代理人: | 李唐明;顿海舟 |
地址: | 511500 广东省清远市清城区高新技术*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 编辑 词库 解析 方法 | ||
1.一种可编辑的云词库的解析方法,该方法以计算机或移动智能设备为应用载体,所述计算机或移动智能设备均设有存储器和内存单元,所述存储器中存储有词库,其特征在于,所述可编辑的云词库的解析方法包括单词的提取方法,所述单词的提取方法包括以下步骤:
S1:录入文本;用户把需要进行解析的文本通过粘贴或输入的方式录入到计算机或移动智能设备的操作界面的文本框中;计算机或移动智能设备把录入的文本存储到所对应的存储器中;
S2:识别特殊字符;识别文本框中录入的文本的初始字符是否为特殊字符;如果录入文本的初始字符不是特殊符号,判断为默认提取模式;如果录入文本的首字符是特殊符号,则根据识别到的特殊字符来判断单词提取的模式;其中,所述特殊字符包括若干个,分别对应不同的提取模式;
S3:根据步骤S2的提取模式,把词库中的单词导入所述内存单元中;
S4:对通过步骤S1存储到存储器中的录入文本按顺序进行单词提取,提取一个单词;
其中,以录入文本中一段连续的英文字母作为一个单词;额外的,单引号与连字符也当成字母进行处理;
S5:把提取的单词与词库中的单词进行匹配:即在通过步骤S3导入内存单元的单词中,查找通过步骤S4提取的单词,从而判断提取的单词在词库中是否存在;若存在,把提取的单词添加到结果集,并进入步骤S6;若不存在,直接进入步骤S6;其中,所述结果集存储在所述存储器中;
S6:判断是否已完成录入文本中所有单词的提取,若未完成,重复S4至S5,直至完成录入文本中所有单词的提取。
2.根据权利要求1所述的一种可编辑的云词库的解析方法,其特征在于:
当S2识别为默认提取模式时,所述步骤S4与S5之间还包括去重步骤S4.1;
S4.1:判断提取的单词在结果集中是否存在;若提取的单词在结果集中存在,跳过S5,进入S6;若提取的单词在结果集中不存在,则不跳过S5。
3.根据权利要求2所述的一种可编辑的云词库的解析方法,其特征在于:
所述提取模式还包括单词原型提取模式;当录入文本的初始字符是特殊符号“//”时,识别为所述单词原型提取模式;当S2识别为单词原型提取模式时,所述步骤S3还调取出单词的变形单词并放进内存单元。
4.根据权利要求3所述的一种可编辑的云词库的解析方法,其特征在于:
当S2识别为单词原型提取模式时,包括所述步骤S4.1,以及在所述步骤S4与去重步骤S4.1之间还包括变形替换步骤S4.2和S4.3:
S4.2:把提取的单词与放入内存单元中的变形单词进行匹配,判断提取的单词是否为变形单词;若提取的单词不是变形单词,进入步骤S4.1;若提取的单词是变形单词,用原型单词替换所述变形单词,以所述原型单词作为提取的单词,进入步骤S4.3;
S4.3:判断步骤S4.2中所述的单词原型在结果集中是否存在;若不存在,把该单词原型添加到结果集,并进入步骤S6;若不存在,直接进入步骤S6。
5.根据权利要求1所述的一种可编辑的云词库的解析方法,其特征在于:
所述提取模式还包括分章节提取模式;当录入文本的初始字符是特殊符号“#”时,识别为所述分章节提取模式;
当S2识别为分章节提取模式时,所述步骤S2和S3之间还包括单元划分步骤S2.1;
S2.1:按行把录入文本划分成若干单元,一行为一个单元,同时把划分成若干单元的录入文本存储到存储器中;
重复步骤S4至S6,按顺序提取录入文本中各个单元的单词,并增加S7,判断是否存在未提取的单元,即:
S4:对通过步骤S2.1存储到存储器中的录入文本的一个单元按顺序进行单词提取,提取一个单词;
S5:把提取的单词与词库中的单词进行匹配;即在内存单元的单词中查找步骤S4中提取的单词,从而判断提取的单词在词库中是否存在;若存在,把提取的单词添加到结果集,并进入步骤S6;若不存在,直接进入步骤S6;
S6:判断是否已完成所述单元中所有单词的提取,若未完成,重复S4至S5,直至完成所述单元中所有单词的提取;
S7:判断是否存在未提取的单元,若存在未提取的单元,对下一个单元重复步骤S4至S6;直至完成录入文本中所有单元的所有单词的提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清远墨墨教育科技有限公司,未经清远墨墨教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810676453.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用户阅读需求分析技术系统
- 下一篇:数据处理方法及装置