[发明专利]一种数据处理方法及装置有效
申请号: | 202010001412.2 | 申请日: | 2020-01-02 |
公开(公告)号: | CN111177306B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 申亚坤 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/335;G06F16/383 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 古利兰 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取非结构化文档,并对所述非结构化文档进行知识梳理,获得对应所述非结构化文档的知识条目;
建立所述非结构化文档和所述知识条目的对应关系,得到关系列表;
将所述关系列表存储至知识库中;
获取检索关键词;
基于所述检索关键词对存储于所述知识库中的所述非结构化文档和所述知识条目同时进行全文检索;
判断优先检索到对应所述检索关键词的知识条目,还是优先检索到对应所述检索关键词的非结构化文档;
若优先检索到对应所述检索关键词的知识条目,获取所述知识条目对应的非结构化文档;
若优先检索到对应所述检索关键词的非结构化文档,获取对应所述检索关键词的非结构化文档。
2.根据权利要求1所述的方法,其特征在于,所述获取非结构化文档,并对所述非结构化文档进行知识梳理,获得对应所述非结构化文档的知识条目,包括:
判断所述非结构化文档表述是否规范;
若是,获取所述非结构化文档中的规范的知识内容;
若否,规范所述非结构化文档中所包含的知识内容,获取规范的知识内容;
对所述规范的知识内容进行知识梳理,获取通过多维度信息对所述知识内容进行描述的知识条目。
3.根据权利要求2所述的方法,其特征在于,所述获取规范的知识内容之后,对所述规范的知识内容进行知识梳理之前,还包括:
判断所述规范的知识内容中是否包含敏感词;
若所述规范的知识内容中包含敏感词,过滤所述规范的知识内容中的敏感词。
4.一种数据处理装置,其特征在于,所述装置包括:
第一获得模块,用于获取非结构化文档,并对所述非结构化文档进行知识梳理,获得对应所述非结构化文档的知识条目;
存储模块,包括:建立单元和存储单元;
所述建立单元,用于建立所述非结构化文档和所述知识条目的对应关系,得到关系列表;
所述存储单元,用于将所述关系列表存储至知识库中;
第二获得模块,包括:第三获取单元、检索单元、第四获取单元和第五获取单元;
所述第三获取单元,用于获取检索关键词;
所述检索单元,用于基于所述检索关键词对存储于所述知识库中的所述非结构化文档和所述知识条目同时进行全文检索;判断优先检索到对应所述检索关键词的知识条目,还是优先检索到对应所述检索关键词的非结构化文档;
所述第四获取单元,用于若优先检索到对应所述检索关键词的知识条目,获取所述知识条目对应的非结构化文档;
所述第五获取单元,用于若优先检索到对应所述检索关键词的非结构化文档,获取对应所述检索关键词的非结构化文档。
5.根据权利要求4所述的装置,其特征在于,所述第一获得模块,包括:
判断单元,用于判断所述非结构化文档表述是否规范;
第一获取单元,用于若所述非结构化文档表述规范,获取所述非结构文档中的规范的知识内容;
规范单元,用于若所述非结构化文档表述不规范,规范所述非结构化文档中所包含的知识内容,获取规范的知识内容;
第二获取单元,用于对所述规范的知识内容进行知识梳理,获取通过多维度信息对所述知识内容进行描述的知识条目。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
判断模块,用于判断所述规范的知识内容中是否包含敏感词;
过滤模块,用于若所述规范的知识内容中包含敏感词,过滤所述规范的知识内容中的敏感词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010001412.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一类含噻唑结构化合物的抗感染用途
- 下一篇:3D存储器件及其制造方法