[发明专利]新闻评论的预测方法和新闻评论的预测系统有效
申请号: | 201610204038.X | 申请日: | 2016-04-01 |
公开(公告)号: | CN107291754B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 刘克松;杨建武;张丹;蔡慧慧;马路 | 申请(专利权)人: | 北京大学;北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06K9/62 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 新闻 评论 预测 方法 系统 | ||
本发明提供了一种新闻评论的预测方法和新闻评论的预测系统,其中,新闻评论的预测方法包括:确定发布新闻所属的领域;获取预设时间范围内用户对所述领域的新闻的评论记录集合;根据所述发布新闻的关键字,确定所述发布新闻属于所述评论记录集合的评论概率;在所述评论记录集合中,确定用户评论过的新闻数量与新闻总数的评论比例;根据所述评论概率和所述评论比例对所述发布新闻的评论数目进行预测。通过本发明的技术方案,提高了对互联网的舆论热点新闻的宏观预测能力和调控性。
技术领域
本发明涉及新闻评论预测技术领域,具体而言,涉及一种新闻评论的预测方法和一种新闻评论的预测系统。
背景技术
随着互联网的飞速发展,特别是手机等移动终端的普及,网络空间上随处可见对公众人物、热点事件、网购商品、影视作品等新闻的评论言论。在大型综合门户网站,一篇具有较高评论次数的新闻往往是网民关心的热点,舆论的焦点,舆情的方向标。掌握网民对新闻的评论情况对了解社情民意具有重要意义。
相关技术中,通常采用用户行为数据对新闻评论进行预测,而不考虑新闻的类型和用户的随机性,从而导致对新闻评论的预测不准确。
因此,如何提高新闻频率的预测方案的准确性成为亟待解决的技术问题。
发明内容
本发明正是基于上述技术问题至少之一,提出了一种新的新闻评论的预测方案,通过获取用户对特定领域的新闻的评论记录集合,并结合发布新闻的内容提取关键字和用户评论的随机性概率,提高了对特定领域的发布新闻的评论进行预测的准确度,提高了对互联网的舆论热点新闻的宏观预测能力和调控性。
有鉴于此,根据本发明的第一方面的实施例,提出了一种新闻评论的预测方法,包括:确定发布新闻所属的领域;获取预设时间范围内用户对所述领域的新闻的评论记录集合;根据所述发布新闻的关键字,确定所述发布新闻属于所述评论记录集合的评论概率;在所述评论记录集合中,确定用户评论过的新闻数量与新闻总数的评论比例;根据所述评论概率和所述评论比例对所述发布新闻的评论数目进行预测。
在该技术方案中,通过获取用户对特定领域的新闻的评论记录集合,并结合发布新闻的内容提取关键字和用户评论的随机性概率,提高了对特定领域的发布新闻的评论进行预测的准确度,提高了对互联网的舆论热点新闻的宏观预测能力和调控性。
其中,发布新闻所属的领域包括体育领域、媒体领域、娱乐领域、政治领域、时尚领域和教育领域等,预设时间范围是自发布新闻的时刻之前的时间段,如发布新闻前一天、一周和一个月等,获取服务器中存储的评论记录集合(包括评论用户ID、评论时间、评论内容和评论频率等),通过新闻内容确定关键字,以及相应的用户的评论比例,确定了用户评论的随机性,另外,评论记录集合从一定程度上反映了用户对发布新闻的关注度,从而提高了对互联网的舆论热点新闻的宏观预测能力和调控性。
在上述技术方案中,优选地,获取预设时间范围内用户对所述领域的新闻的评论记录集合,具体包括以下步骤:获取所述预设时间范围内,创建二维评论矩阵作为所述评论记录集合,其中,所述二维评论矩阵中的任一元素表示为Xij,所述二维评论矩阵中的行表示一个用户,所述二维评论矩阵的列表示所述领域的一个新闻,赋值Xij为1时表示所述一个用户对所述领域的一个新闻进行了评论,赋值Xij为0时表示所述一个用户未对所述领域的一个新闻进行评论。
在该技术方案中,通过创建二维评论矩阵作为评论记录集合,更加直观地反映了用户对发布新闻进行评论的随机概率,其中,二维评论矩阵采用余弦相似度算法进行创建,每个元素Xij还包含新闻的关键词等标识信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;北大方正集团有限公司;北京北大方正电子有限公司,未经北京大学;北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610204038.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于用户的个性化数据搜索方法和装置
- 下一篇:一种终端推送方法及装置