[发明专利]一种结合知识图谱和文本信息的相关公司挖掘方法在审
申请号: | 201810898419.1 | 申请日: | 2018-08-08 |
公开(公告)号: | CN109614495A | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 龙世增;蔡瑞初;毕辉;李楠 | 申请(专利权)人: | 广州初星科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 511400 广东省广州市番*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图谱 文本信息 知识库 关系提取模块 模型库管理 公司实体 关系抽取 提取数据 挖掘系统 训练模块 用户反馈 预测模块 准确度 挖掘 模型库 样本库 存储 补充 预测 保证 发现 学习 | ||
本发明是一种结合知识图谱和文本信息的相关公司挖掘方法。结合知识图谱和文本信息的相关公司挖掘系统包括:深度学习关系抽取模块、知识库关系提取模块、PRA训练模块、PRA预测模块、模型库管理模块、用户反馈模块。用户可以从样本库中提取数据训练PRA模型,并存入模型库,还可以通过提取end‑to‑end模型和存储训练的PRA模型,以此预测公司的相关公司及公司之间的关系,作为公司知识图谱的一种发现和补充。本发明将知识图谱中的公司实体关系当作PRA中的限定集,保证了限定集的准确度同时又最大限度降低了限定集的规模,减少了无关路径的数量。
技术领域
本发明属于网络信息处理技术领域,具体涉及一种结合知识图谱和文本信息的相关公司挖掘方法。
背景技术
在人工智能兴起的大背景下,知识图谱作为一种全面的表达方式已经得到越来越多的关注,越来越多的研究者投入到了知识图谱的研究中。
福尔摩斯说过:“一个逻辑学家,不需要亲眼见过,或听过大西洋和尼亚加拉大瀑布,他从一滴水中就能推测出它们。知识图谱就像福尔摩斯破案一样,首先需要采集散布在各个角落的碎片化信息和数据,然后把它按标准化思考方式整理,再将各个看似不相关但背后有着共同联系的信息关联起来挖掘背后的规律,据此做深入的推理。
2012年,Google率先在自己的搜索引擎中加入了知识图谱,当用户查询关键词的时候,不仅能够得到相关网页,还可以得到更多与查询词相关的其他信息。从技术的角度来说,知识图谱是一个由数据到信息再到知识,最后转化为智慧的过程。
知识图谱技术包括以下三个方面的研究内容:
1)知识表示:研究客观世界知识的建模,以方便机器识别和理解,既要考虑知识的表示与存储,又要考虑知识的使用和计算;
2)知识图谱构建:解决如何建立计算机算法从客观世界或者互联网的各种数据资源中获取客观世界的知识,主要研究使用何种数据和方法抽取何种知识;
3)知识图谱应用:主要研究如何利用知识图谱建立基于知识的智能服务系统,更好地解决实际应用问题。
知识图谱为互联网上海量、异构、动态的大数据表达、组织、管理以及利用提供了一种更为有效的方式,使得网络的智能化水平更高,更加接近于人类的认知思维。在关注到知识图谱在自然语言处理、人工智能等领域展现巨大潜力的同时,也不难发现知识图谱中的知识获取、知识表示、知识推理等技术依然面临着一些困难与挑战,很多重要的开放问题急待学术界与工业界协力来解决。知识图谱的主要挑战问题主要包括:1.知识的自动获取;2.多源知识的自动融合;3.面向知识的表示学习;4.知识推理与应用等。在开放源的文本中,如何提取实体和实体之间的关系,一直是知识图谱领域中一个比较棘手的问题。围绕这方面研究主要是entity 和relation extraction。虽然NLP领域也对这个问题研究了很多年,但是在开放信息源中的效果并不是很理想。在未来的几年时间内,知识图谱仍将是大数据智能的前沿研究问题。其中,知识图谱和文本信息的结合将是其中一个重要的方向。
现如今,公司之间的竞争越来越激烈,因此,研究竞争对手,寻找合作伙伴等都变得越来越重要,研究竞争对手可以让公司明白自己与对手相比之下的优势或劣势,有便于差异化竞争或针对性的补强,在与同级别同领域的竞争中确立优势。寻找合作伙伴,确立合作关系,公司之间的信息共享,资源共享等更能直接的让公司具备更强的竞争力,因此,公司之间的关系挖掘是十分具有价值的。
发明内容
为了解决上述问题,本发明提出了一种结合知识图谱和文本信息的相关公司挖掘的方法。本发明将知识图谱中的公司实体关系当作PRA中的限定集,保证了限定集的准确度同时又最大限度降低了限定集的规模,减少了无关路径的数量。
本发明的结合知识图谱和文本信息的相关公司挖掘方法,结合知识图谱和文本信息的相关公司挖掘包括有:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州初星科技有限公司,未经广州初星科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810898419.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文本分类方法及相关装置
- 下一篇:一种基于知识图谱的低保鉴别方法