[发明专利]一种新闻传播溯源的分析方法在审
申请号: | 202010303524.3 | 申请日: | 2020-04-16 |
公开(公告)号: | CN111522912A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 徐利东;远贵良 | 申请(专利权)人: | 山东贝赛信息科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/955;G06F40/126;G06F40/194 |
代理公司: | 济南瑞宸知识产权代理有限公司 37268 | 代理人: | 王萍 |
地址: | 250000 山东省济南市经十路7000号*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新闻 传播 溯源 分析 方法 | ||
1.一种新闻传播溯源的分析方法,其特征在于所述的新闻传播溯源的分析步骤如下:
步骤1:数据采集网页:利用网页提取技术,提取网页内的全部信息数据;
步骤2:编码处理:针对网页采集信息中标题和正文分别进行编码处理;
步骤3:编码比对:将编码同历史文章的编码进行比对,输出相似度;
步骤4:比较相似度:比较相似度接近文章的作者、发布时间和来源站点;
步骤5:相似文章输出排序:输出数据分析结果,将相似文章输出,输出结果按照发布时间排序;
步骤6:输出结果:输出溯源分析结果,完成新闻传播溯源。
2.根据权利要求1所述的一种新闻传播溯源的分析方法,其特征在于:所述的数据采集网页提取的全部信息数据包括标题、正文、作者、发布时间等结构化数据。
3.根据权利要求1所述的一种新闻传播溯源的分析方法,其特征在于:所述的编码处理针对标题和正文分别进行hash编码。
4.根据权利要求1所述的一种新闻传播溯源的分析方法,其特征在于:所述的比较相似度中分析是否是同一个文章还是二次传播的文章。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东贝赛信息科技有限公司,未经山东贝赛信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010303524.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机械离合装置
- 下一篇:下单方法、订单处理方法、终端和服务器