[发明专利]文本的专有名词处理方法、装置和计算机设备在审
申请号: | 201910311158.3 | 申请日: | 2019-04-18 |
公开(公告)号: | CN110134846A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 许剑勇 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F17/27 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊;王宁 |
地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 计算机设备 访问地址 名词标记 用户体验度 正则表达式 标记过程 存储介质 工作效率 解释内容 解释信息 请求获取 页面内容 用户参与 指令获取 终端触发 终端发送 专有词库 自动提取 自动完成 大数据 数据库 指令 终端 申请 分析 | ||
1.一种文本的专有名词处理方法,所述方法包括:
获取专有名词标记指令;
根据所述专有名词标记指令获取各待标记的文本;
基于数据库中的专有词库对各所述待标记的文本进行分析,提取各所述待标记的文本的专有名词;
将各所述待标记的文本的专有名词进行标记;
当接收到用户通过终端触发文本中标记的所述专有名词的解释请求时,根据所述解释请求获取访问地址;
通过正则表达式对所述访问地址中的页面内容进行爬取,获得所述专有名词的解释信息。
2.根据权利要求1所述的方法,其特征在于,所述基于数据库中的专有词库对各所述待标记的文本进行分析,提取各所述待标记的文本的专有名词的步骤,包括:
对所述待标记的文本进行分词处理,获取各词语;
获取各所述词语与所述专有词库中的专有名词的交集;
将交集中的词语确定为各所述待标记的文本中的专有名词。
3.根据权利要求1所述的方法,其特征在于,所述专有词库的建立方式包括:
通过大数据获取与所述待标记的文本内容相关的文本;
对所述待标记的文本内容相关的文本中的内容进行分词处理,获得各待分析词语;
对各所述待分析词语进行分析,确定专有名词;
将各所述专有名词保存到专有词库中。
4.根据权利要求3所述的方法,其特征在于,所述对各所述待分析词语进行分析,确定专有名词的步骤,包括:
获取搜索引擎的搜索数据;
获取根据搜索数据中的搜索词与各所述待分析词语的交集;
将交集中的各所述待分析词语确定为专有名词。
5.根据权利要求4所述的方法,其特征在于,所述对各所述待分析词语进行分析,确定专有名词的步骤,还包括:
对未在交集中的所述搜索词进行分析,确定所述搜索词的搜索次数;
将所述搜索次数大于预设次数的搜索词确定为专有名词。
6.根据权利要求1所述的方法,其特征在于,所述当接收到用户通过终端触发文本中标记的所述专有名词的解释请求时,根据所述解释请求获取访问地址的步骤,包括:
当接收到用户通过终端触发文本中标记的所述专有名词的解释请求时,获取所述解释请求中携带的专有名词;
将所述专有名词与预设的访问地址模板进行拼接,获得访问地址。
7.根据权利要求1所述的方法,所述通过正则表达式对所述访问地址中的页面内容进行爬取,获得所述专有名词的解释信息的步骤,包括:
通过正则表达式对所述访问地址中的页面内容进行爬取,获得页面内容;
根据预设的信息截取规则对所述页面内容进行信息截取,获得所述专有名词的解释信息。
8.一种文本的专有名词处理装置,其特征在于,所述装置包括:
指令获取模块,用于获取专有名词标记指令;
调查问卷获取模块,用于根据所述专有名词标记指令获取各待标记的文本;
专有名词提取模块,用于基于数据库中的专有词库对各所述待标记的文本进行分析,提取各所述待标记的文本的专有名词;
专有名词标记模块,用于将各所述待标记的文本的专有名词进行标记;
访问地址获取模块,用于当接收到用户通过终端触发文本中标记的所述专有名词的解释请求时,根据所述解释请求获取访问地址;
解释信息获取模块,用于通过正则表达式对所述访问地址中的页面内容进行爬取,获得专有名词的解释信息。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910311158.3/1.html,转载请声明来源钻瓜专利网。