[发明专利]一种可编辑的云词库的解析方法有效
申请号: | 201810676453.4 | 申请日: | 2018-06-27 |
公开(公告)号: | CN109033183B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 谭锦钿;毛小兰;林楠 | 申请(专利权)人: | 清远墨墨教育科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 广州圣理华知识产权代理有限公司 44302 | 代理人: | 李唐明;顿海舟 |
地址: | 511500 广东省清远市清城区高新技术*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 编辑 词库 解析 方法 | ||
一种可编辑的云词库的解析方法,包括单词的提取、普通短语的提取以及特殊短语的提取。不但能够提取文本中的单词,还能识别并提取文本中的单词原型,进而能够根据结果集生成用户所需的单词复习列表;同时也能识别用户根据自身需求,分章节的识别并提取单词复习列表,能满足用户个性化定制的需求;另外,对短语进行识别和提取,用户不仅能自定义单词的复习列表,还能自定义短语的复习列表。
技术领域
本发明涉及计算机领域,尤其涉及一种可编辑的云词库的解析方法。
背景技术
词库是词语资料的集合,存贮于数据库中以备特定的程序检索调用,如电子词典或安装于移动智能设备中的背单词软件,都需要调取词库。
现有技术中,已存在各种各样的云词库,供用户进行选择和下载。以英语词汇为例,如小学、初中、高中的英语词库,大学英语四、六、八级词库,考研或考博英语词库,雅思或托福词库等。虽然现有的英语词库多种多样,但依然存在弊端,用户不能根据自身需求去订制词库。例如,当用户需要阅读某一英文电子文章或书籍时,遇到生词只能逐个去查或者记录,其阅读的效率与质量。如果在阅读前,能够先把文章或书籍的单词进行识别,再筛选出生词,生成自定义单词复习列表,用户可先对筛选出的生词进行学习,再进行文章或书籍的阅读,提高其学习或阅读的效率。又如,当用户需要阅读某一专业领域的文献时,若可自行编辑词库,甚至对专业名词进行自定义解释,也可大大提高其学习或阅读的效率。
为了满足用户的个性化定制的需求,自定义单词复习列表,需要一种可编辑的云词库。
发明内容
为了实现可编辑的云词库,自定义单词复习列表,需要一种可编辑的云词库的解析方法,来进行单词或短语的识别与提取,其技术方案如下:
一种可编辑的云词库的解析方法,该方法以计算机或移动智能设备为应用载体,所述计算机或移动智能设备均设有存储器和内存单元,所述存储器中存储有词库,所述可编辑的云词库的解析方法包括单词的提取方法,所述单词的提取方法包括以下步骤:
S1:录入文本;用户把需要进行解析的文本通过粘贴或输入的方式录入到计算机或移动智能设备的操作界面的文本框中;计算机或移动智能设备把录入的文本存储到所对应的存储器中;
S2:识别特殊字符;识别文本框中录入的文本的初始字符是否为特殊字符;如果录入文本的初始字符不是特殊符号,判断为默认提取模式;如果录入文本的首字符是特殊符号,则根据识别到的特殊字符来判断单词提取的模式;其中,所述特殊字符包括若干个,分别对应不同的提取模式;
S3:根据步骤S2的提取模式,把词库中的单词导入所述内存单元中;
S4:对通过步骤S1存储到存储器中的录入文本按顺序进行单词提取,提取一个单词;
其中,以录入文本中一段连续的英文字母作为一个单词;额外的,单引号与连字符也当成字母进行处理;
S5:把提取的单词与词库中的单词进行匹配:即在通过步骤S3导入内存单元的单词中,查找通过步骤S4提取的单词,从而判断提取的单词在词库中是否存在;若存在,把提取的单词添加到结果集,并进入步骤S6;若不存在,直接进入步骤S6;其中,所述结果集存储在所述存储器中;
S6:判断是否已完成录入文本中所有单词的提取,若未完成,重复S4至S5,直至完成录入文本中所有单词的提取。
当S2识别为默认提取模式时,所述步骤S4与S5之间还包括去重步骤S4.1;
S4.1:判断提取的单词在结果集中是否存在;若提取的单词在结果集中存在,跳过S5,进入S6;若提取的单词在结果集中不存在,则不跳过S5。
所述提取模式还包括单词原型提取模式;当录入文本的初始字符是特殊符号“//”时,识别为所述单词原型提取模式;当S2识别为单词原型提取模式时,所述步骤S3还调取出单词的变形单词并放进内存单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清远墨墨教育科技有限公司,未经清远墨墨教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810676453.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用户阅读需求分析技术系统
- 下一篇:数据处理方法及装置