[发明专利]一种基于BERT的新闻热点预测方法及装置在审
申请号: | 202210322678.6 | 申请日: | 2022-03-29 |
公开(公告)号: | CN114817529A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 陈慧 | 申请(专利权)人: | 上海二三四五网络科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/284;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200137 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 bert 新闻 热点 预测 方法 装置 | ||
本发明公开了一种基于BERT的新闻热点预测方法,其预测待预测新闻成为热点新闻的概率,包括如下步骤:a.将一个或多个第一待预测新闻特征处理后代入热点新闻预测模型,并确定一个或多个热点新闻模型预测结果为正的第二待预测新闻以及与所述第二待预测新闻相对应的热点概率,其中,所述特征处理至少包括将从所述第一待预测新闻中所提取的新闻标题以及新闻实体拼接处理后转换为字向量;b.按照热点概率从高至低的顺序对所述第二待预测新闻进行第一排序;c.基于每个第二待预测新闻的牛顿冷却权重以及所对应的热点概率进行第二排序。本申请操作简单,功能强大,预测精确,具有极高的商业价值。
技术领域
本发明属于热点新闻研究领域,特别涉及一种基于BERT的新闻热点预测方法及装置。
背景技术
在互联网初期,热门新闻的推荐方法得到了发展并在雅虎等网站使用。相比于目前大数据时代以个性化为主的推荐方法来说,热门新闻推荐仍然有着很大的优势:
1、社会热点话题的载体:热门新闻往往代表了社会的热点话题和舆论,热门新闻往往是大部分人关注的热点;
2、有利于用户冷启动:个性化推荐主要是依赖用户的历史行为数据来预测用户的偏好,以此来实现个性化新闻推荐。但是对于新用户来说,系统缺乏用户的历史行为数据,此时个性化推荐远远不如热门推荐的效果;
3、解决内容质量问题:纯粹的个性化推荐。
系统对文章的质量和内容是没有把关的,热门新闻质量往往优于偏僻的长尾新闻,目前常用的热门新闻预测主要有:
1、人工运营。使用人工运营的方式,从新闻种发现热点新闻。这无疑需要巨大的运营成本;
2、依赖用户点击热度、点击量、转发评论、收藏等用户行为和反馈的热门新闻计算方案。这虽然能一定程度上展现用户的真实关注意愿,但是这种依赖用户行为的方法天生就具有滞后性,它并不能在新闻发布初期就检测出来,需要等待用户反馈。另外,这种方案还依赖于系统是否给予足够的曝光,如果系统并没有给新闻以足够的曝光,那么这条新闻的热度就一直上不去,便会错失热点新闻,使得热门新闻的召回率较低;
3、利用自然语言技术,进行分词、实体识别、关键信息提取,例如火神山医院、口罩等,并将这些实体与微博、新闻网站、微信公众号、论坛等热榜进行匹配。这种方法往往依赖于已知的当下热点时间和热点新闻,并不能发现新的热点新闻和时间。另外,这种方法需要将热点与候选新闻进行笛卡尔积后一一匹配,计算成本巨大。
CN202010357802.3公开了一种问答社区中的热门问题的预测方法及系统的发明专利,其采用全面信息提高热门问题的识别率和识别精度,然而其采用的是全卷积神经网络,模型较老,精度不够,且其需要依赖用户的投票,这对于没有任何数据的冷启动新闻来说并不适用,其无法抽取新闻的实体,只是把标题和正文文本进行训练,全卷积网络模型很难学习到与自带流量的实体有关的信息。
而目前,并没有一种能够解决本申请技术问题的技术方案,具体地,并没有一种基于BERT的新闻热点预测方法及装置。
发明内容
针对现有技术存在的技术缺陷,本发明的目的是提供一种基于BERT的新闻热点预测方法及装置,根据本发明的一个方面,提供了一种基于BERT的新闻热点预测方法,其预测待预测新闻成为热点新闻的概率,包括如下步骤:
a.将一个或多个第一待预测新闻特征处理后代入热点新闻预测模型,并确定一个或多个热点新闻模型预测结果为正的第二待预测新闻以及与所述第二待预测新闻相对应的热点概率,其中,所述特征处理至少包括将从所述第一待预测新闻中所提取的新闻标题以及新闻实体拼接处理后转换为字向量;
b.按照热点概率从高至低的顺序对所述第二待预测新闻进行第一排序;
c.重复执行步骤a,并基于每个第二待预测新闻的牛顿冷却权重以及所对应的热点概率进行第二排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海二三四五网络科技有限公司,未经上海二三四五网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210322678.6/2.html,转载请声明来源钻瓜专利网。