[发明专利]社群文章影响力预测方法以及社群文章影响力预测装置在审
申请号: | 201510845211.X | 申请日: | 2015-11-27 |
公开(公告)号: | CN106776667A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 吴家齐;林鼎家;林蔚君;詹雅慧 | 申请(专利权)人: | 财团法人资讯工业策进会 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 梁丽超,陈鹏 |
地址: | 中国*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社群 文章 影响力 预测 方法 以及 装置 | ||
1.一种社群文章影响力预测方法,用以预测一社群文章的一预测影响力,其中该预测影响力为该社群文章所获得的互动量的一估计值,其特征在于,包括下列步骤:
步骤A:对该社群文章执行一议题分析,以分类该社群文章所属的一内容领域;
步骤B:计算该社群文章内的多个字词的字词权重,并根据所述字词权重获得该社群文章的一基础影响力,其中该基础影响力为该社群文章发表经过一第一预设时间后所获得的互动量的一初始估计值;
步骤C:收集该社群文章的一作者的至少一作者历史文章,并根据该作者历史文章的互动量计算一第一影响力平均值,接着将该第一影响力平均值与一第一参考影响力平均值相减,以获得一作者一般影响力修正量,其中该第一参考影响力平均值为所有历史文章的互动量的一平均值;
步骤D:筛选该作者在该内容领域的至少一作者-领域历史文章,并根据该作者-领域历史文章的互动量计算一第二影响力平均值,接着将该第二影响力平均值与一第二参考影响力平均值相减,以获得一作者领域影响力修正量,其中该第二参考影响力平均值为该内容领域的所有历史文章的互动量的一平均值;及
步骤E:根据该基础影响力、该作者一般影响力修正量以及该作者领域影响力修正量,计算该预测影响力。
2.根据权利要求1所述的社群文章影响力预测方法,其中步骤A还包括下列步骤:
步骤A-1:分析该社群文章内的所述字词,并判断所述字词属于一情绪词或一否定词,其中该情绪词分为正向情绪词或负向情绪词;
步骤A-2:汇整该社群文章内的情绪词或否定词,并判断该社群文章的一情绪极性;及
步骤A-3:根据该正向情绪词或该负向情绪词出现于该社群文章的一比例判断一情绪强度。
3.根据权利要求1所述的社群文章影响力预测方法,其中步骤B为根据TF-IDF方法计算所述字词的字词权重,并排序所述字词权重以获得该社群文章的多个代表字词。
4.根据权利要求3所述的社群文章影响力预测方法,其中步骤B还包括下列步骤:
步骤B-1:获取该社群文章于发表前一第二预设时间内,以该社群文章的代表字词的至少其中一者作为一代表字词的至少一参考历史文章;
步骤B-2:根据该参考历史文章的互动量计算该社群文章的所述代表字词在该社群文章发表前的平均影响力;及
步骤B-3:将所述代表字词的字词权重与对应的平均影响力做加权平均运算,以获得该社群文章的基础影响力。
5.根据权利要求1所述的社群文章影响力预测方法,还包括下列步骤:
步骤F:根据所述字词权重判断该社群文章所属的至少一新闻事件,并根据该新闻事件计算一事件影响力修正量,其中该新闻事件包括与该社群文章同性质的至少一新闻;及
步骤G:根据该基础影响力、该作者一般影响力修正量、该作者领域影响力修正量以及该事件影响力修正量,计算该预测影响力。
6.根据权利要求5所述的社群文章影响力预测方法,其中步骤F还包括下列步骤:
步骤F-1:分别计算多个新闻内的多个字词的字词权重;
步骤F-2:根据所述字词权重判断所述新闻之间的一文章相似度;
步骤F-3:比较所述新闻之间的一发表时间,并计算所述新闻彼此间的发表时间间隔;及
步骤F-4:将所述新闻中该文章相似度大于等于一最小相似度,且发表时间间隔低于一最短时间间隔的新闻汇总成一新闻事件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人资讯工业策进会,未经财团法人资讯工业策进会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510845211.X/1.html,转载请声明来源钻瓜专利网。