[发明专利]一种基于知识图谱模型的信息检索方法有效
申请号: | 202211388526.2 | 申请日: | 2022-11-08 |
公开(公告)号: | CN115438141B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 刘伟华;严宇 | 申请(专利权)人: | 智慧眼科技股份有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06N3/04;G06N3/08;G06F16/332;G06F16/33;G06F16/335;G06F16/36;G06F40/284 |
代理公司: | 深圳众鼎汇成知识产权代理有限公司 44566 | 代理人: | 朱业刚 |
地址: | 410205 湖南省长沙市高新*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 模型 信息 检索 方法 | ||
本发明提供了一种基于知识图谱模型的信息检索方法,涉及人工智能技术领域,包括:获取文本知识资料,并基于所述文本知识资料构建语料库;采用分词方法对所述语料库中的每个句子进行分词处理,根据得到的分词结果进行实体词抽取、关系词抽取和停用词抽取;根据抽取的实体词、关系词和停用词数据处理构建四元组子图数据,并将四元组子图数据存储至图数据库,完成知识图谱的构建,所述四元组子图数据结构类型为“实体词—关系词—实体词—停用词”;在接收到用户输入的查询请求时,对所述查询请求中的自然语言问句进行分析,检索出问题的答案,本发明通过知识图谱的自动构建,避免了查阅信息和网页搜索的低效和繁琐。
技术领域
本发明涉及人工智能技术领域,具体涉及到一种基于知识图谱模型的信息检索方法。
背景技术
知识图谱是将实体作为节点(实体是客观存在的事物),将关系作为边的数据结构,其中,关系是描述两个实体之间的联系,比如“同事”、“夫妻”等。已知某个实体和关系,则能从知识图谱中快速检索出相关的另外一个实体。目前的知识图谱在构建的时候,需要人为定义各种关系,过程较为复杂。且多采用聚类算法等对指定数据进行迭代计算,检索出主题,导致计算量较大,进而降低了检索效率,还有一些传统的方法仅通过抽取的方式构建知识地图谱,导致容易出现部分关系丢失的情况,使得查询结果不准确。
综上所述,如何克服上述缺陷,是本领域技术人员急需解决的问题。
发明内容
本方案针对上文提到的问题和需求,提出一种基于知识图谱模型的信息检索方法,具体由于采取了如下技术方案而能够解决上述技术问题。
为实现上述目的,本发明提供如下技术方案:一种基于知识图谱模型的信息检索方法,包括:
获取文本知识资料,并基于所述文本知识资料构建语料库;
采用分词方法对所述语料库中的每个句子进行分词处理,根据得到的分词结果进行实体词抽取、关系词抽取和停用词抽取;
根据抽取的实体词、关系词和停用词数据处理构建四元组子图数据,并将所述四元组子图数据存储至图数据库,完成知识图谱的构建,所述四元组子图数据结构类型为“实体词—关系词—实体词—停用词”;
在接收到用户输入的查询请求时,对所述查询请求中的自然语言问句进行分析,得到所述自然语言问句对应的实体词,根据所述自然语言问句对应的实体词和所述知识图谱中的四元组子图数据检索出问题的答案。
进一步地,所述基于所述文本知识资料构建语料库包括:
对所述文本知识资料进行篇章划分和句子划分;
为每个句子分配一个id,采用每个句子构建一个子图数据;
记录每个子图数据对应的id的前一个子图数据对应的id和后一个子图数据对应的id,并将记录的id信息和每个句子的内容进行关联存储得到语料库。
进一步地,所述根据抽取的实体词、关系词和停用词数据处理构建四元组子图数据之前,所述方法还包括:
构建一个修饰关系预测模型,所述修饰关系预测模型用于确定第一实体词和第二实体词之间的修饰关系;
所述修饰关系预测模型的构建步骤如下:
构建训练样本集,所述训练样本集包括不同的文本知识资料样本语句及其语句标注信息,所述文本知识资料样本语句为与用户可能会问到的自然语言问句相关的文本信息,所述语句标注信息包括文本中的实体词以及实体词之间的修饰关系标签,若文本中两个实体词之间没有关系词,则用“缺失”进行填充;
将训练样本集中的样本语句进行向量化处理,得到对应的样本语句特征向量,将所述样本语句特征向量转化为可以被并行操作的数据集RDD,基于所述数据集RDD,利用朴素贝叶斯分类算法训练得到朴素贝叶斯分类器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智慧眼科技股份有限公司,未经智慧眼科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211388526.2/2.html,转载请声明来源钻瓜专利网。