[发明专利]一种适于事件归因的上市公司知识图谱构建方法及装置在审
申请号: | 201811205312.0 | 申请日: | 2018-10-16 |
公开(公告)号: | CN109558492A | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 郑子彬;梁宇轩 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/951;G06N3/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种适于事件归因的上市公司知识图谱构建方法及装置,本装置用于实现本方法,本方法包括利用获取的上市公司的个股基本面信息及相关的个股历史新闻生成金融词典;利用获取的各上市公司相关的实时新闻生成实时新闻数据库;通过文本分类器对实时新闻进行文本分类;抽取新闻文本信息;采用图数据库Neo4J实现上市公司知识图谱构建实体知识图谱,根据特定新闻内容,对图谱上的节点进行跟踪,以构造出具有事件归因功能的上市公司知识图谱。 | ||
搜索关键词: | 实时新闻 图谱构建 图谱 数据库 文本分类器 历史新闻 文本分类 新闻内容 新闻文本 基本面 抽取 跟踪 金融 | ||
【主权项】:
1.一种适于事件归因的上市公司知识图谱构建方法,其特征在于,包括:S10生成金融词典:获取若干上市公司个股基本面信息及历史新闻,提取关键词句生成金融词典;S20生成实时新闻数据库:获取上市公司实时新闻,生成实时新闻数据库;S30设计文本分类器:借用金融词典从实时新闻库中抽取出实时新闻语料,以用来训练文本分类器,采用第一卷积神经网络模型对实时新闻进行文本分类;S40抽取文本信息:借用金融词典对归类后的实时新闻进行信息抽取,将非结构化信息转化为适配新闻数据库的结构化信息;S50构建实体知识图谱:利用Neo4J图形数据库的数据结构中图的概念建立上市公司知识图谱的初始模型,其中以上市公司个股基本面信息为节点,以各个上市公司之间的关系为边界,输入由S40信息抽取得到的实体新闻信息,生成上市公司知识图谱。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811205312.0/,转载请声明来源钻瓜专利网。