[发明专利]一种结合内容和图谱的舆情事件推荐方法、系统及终端在审
申请号: | 202111494086.4 | 申请日: | 2021-12-08 |
公开(公告)号: | CN114153965A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 石珺;张立灿;林丽敏;李志鹏;张杰 | 申请(专利权)人: | 深圳市网联安瑞网络科技有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/36 |
代理公司: | 广东普润知识产权代理有限公司 44804 | 代理人: | 寇闯 |
地址: | 518000 广东省深圳市福田区华富街道新田社区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 内容 图谱 舆情 事件 推荐 方法 系统 终端 | ||
1.一种结合文本内容和知识图谱的舆情事件推荐方法,其特征在于,所述结合文本内容和知识图谱的舆情事件推荐方法包括:将领域知识图谱和舆情事件推荐进行结合,在进行舆情事件推荐时,将舆情事件整合到领域知识图谱中;基于舆情事件在领域知识图谱中的结构和属性,通过多角度的分析和计算,最终从舆情事件文本和图谱网络结构的角度获得推荐列表。
2.根据权利要求1所述的结合文本内容和知识图谱的舆情事件推荐方法,其特征在于,所述结合文本内容和知识图谱的舆情事件推荐方法具体包括:
步骤一,非周期性更新的新事件信息提取及入库;
步骤二,周期性历史事件信息更新入库;
步骤三,周期内新事件信息更新入库;
步骤四,相关舆情事件推荐。
3.根据权利要求2所述的结合文本内容和知识图谱的舆情事件推荐方法,其特征在于,所述步骤一非周期性更新的新事件信息提取及入库具体包括:
第一步,爬取当前时间段内所有社交平台的舆情文本数据,所述舆情文本数据包括文章、贴文;
第二步,采用领域关键词过滤爬取的舆情数据,保留领域内的舆情文本数据;
第三步,采用事件提取算法提取当前时间段关于该领域的所有事件,并对事件分配相应的类别;同时,利用textrank算法计算相应事件文本数据的关键词及权重,并通过语言模型计算每个关键词的词向量,再经过关键词词向量的加权平均计算出事件文本向量;还通过热度、危度、焦度网络舆情指标计算每个事件的影响力指数,选取影响力最大的事件文本进行事件描述内容提取,并对描述内容进行实体及关系抽取,通过实体消歧和实体链接的方式,整合到当前的领域知识图谱中;
第四步,将新事件的事件类别、事件关键词及权重、事件文本表示、事件影响力值、事件文本摘要信息及整合新事件的知识图谱信息更新到事件信息库中。
4.根据权利要求2所述的结合文本内容和知识图谱的舆情事件推荐方法,其特征在于,所述步骤二周期性历史事件信息更新入库具体包括:
事件信息库中周期性历史事件信息计算的数据包括知识图谱表示、结合知识图谱和事件文本的事件表示以及当前事件库内所有事件的推荐列表;
图谱知识表示计算:采用TransE的知识表示方法对整个领域图谱的信息进行嵌入;
事件文本表示计算:通过textrank方法提取事件文本的关键词以及相应的权重,并用给word2vec模型计算每个关键词的嵌入,并通过公式(1)计算事件文本向量:
其中c表示事件文本向量,n表示事件文本的关键数量,xi表示第i个关键词的嵌入,wi表示第i个关键词的权重;
事件表示计算:用于相似度计算的事件表示结合事件的知识表示及事件的文本表示,通过自定义的权重进行加权求和获取,公式为:
v=w1u+w2c (2)
其中v表示最终的事件向量,u表示事件知识表示向量,w1表示事件知识表示向量的权重,c表示事件文本向量,w2表示事件文本向量的权重;
推荐列表计算,在周期性更新中,基于相似事件表示进行推荐,利用Faiss的相似度计算和检索方法以及向量储存方法储存向量和计算当前事件与其他历史事件的相似度s;相似度计算、检索方法和向量储存方法根据数据量大小以及需求的不同做选择;再通过除去s<阈值d的历史事件,并在剩下的事件中选取相似度最大的k个历史事件作为推荐结果;若最终推荐结果不满足k个,则选取当前事件所属事件类别下影响力值最大的k-n个事件作为补充,其中n为基于事件表示的推荐结果数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市网联安瑞网络科技有限公司,未经深圳市网联安瑞网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111494086.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种金属折弯机构
- 下一篇:一种耗能的可变阻尼间隔棒
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法