[发明专利]一种新闻推荐算法的优化方法和装置在审
申请号: | 202210887401.8 | 申请日: | 2022-07-26 |
公开(公告)号: | CN115146175A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 金和平;朱强;张贺;章啸程;刘苇;宋百川;刘晓青;辜斌;赵鲲;王建东;田武;周灿;潘建初;张晓萌;姜鹏;习兰云 | 申请(专利权)人: | 中国长江三峡集团有限公司;上海勘测设计研究院有限公司;三峡高科信息技术有限责任公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9537 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 李斯锐 |
地址: | 100038 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新闻 推荐 算法 优化 方法 装置 | ||
本发明公开了一种新闻推荐算法的优化方法和装置,所述方法包括:在新闻平台上获取一预设时间段内发布的所有与安全事故相关的新闻,对所述所有新闻进行去重处理,得到第一新闻集合,其中所述去重处理剔除了在两个或两个以上平台发布的同一新闻;对所述第一新闻集合进行筛选得到第二新闻集合;对所述第二新闻集合中的每个新闻进行打分,得到与每个新闻对应的分数值;根据所述分数值训练出相关新闻的推荐算法,本方法基于IDC工程建设和运行过程中使用的设备类型和数量,运用推荐系统思想和技术,定期对指定设备到安全事故新闻报道和事故新闻到制定设备进行双向推荐,从而及时发现IDC站点内设施的相关隐患,便于事先做出安全预案。
技术领域
本发明涉及大数据分析技术领域,具体涉及一种新闻推荐算法的优化方法和装置。
背景技术
互联网数据中心(Internet Data Center,IDC)是一个组织或单位用以集中放置计算机系统,以及诸如通信和存储等相关设备的基础设施;或者也可能是以外包方式允许许多其他公司存放的设备或数据的地方。
IDC工程对建成后运行的安全性有很高要求,除了在各类问题出现后及时维修或更换设备外,根据设备运行维保信息、天气信息等对安全隐患进行预测,对IDC工程的安全运行也起到一定作用。另外,相关信息来源不同,缺乏公开的数据集进行预训练,对于不同类型不同品牌甚至不同批次的设备也难以通过某一产品的历史数据训练后迁移到其它产品。
此外,除了上述因素决定IDC工程安全运行之外,还期望通过历史数据对IDC工程安全进行预测,比如定期通过相关安全事故报道、新闻以及文字,来分析可能发生的安全事故,发现安全隐患,但目前无法根据历史数据对IDC安全事故进行排查和预测。
发明内容
为了解决上述无法根据历史数据对IDC安全事故进行预测和排查的技术问题,本申请实施例提供了如下技术方案:
第一方面,本发明实施例公开了一种新闻推荐算法的优化方法,该方法包括:在新闻平台上获取一预设时间段内发布的所有与安全事故相关的新闻,所述所有新闻来自一个或多个新闻发布平台;对所述所有新闻进行去重处理,得到第一新闻集合,对所述第一新闻集合进行筛选,得到第二新闻集合,对所述第二新闻集合中的每个新闻进行打分,得到与每个新闻对应的分数值;根据所述分数值训练出相关新闻的推荐算法,所述推荐算法用于为与所述安全事故关联的新闻推荐更多相关的新闻。
其中,所述去重处理剔除了在两个或两个以上平台发布的同一新闻,所述第二新闻集合中的至少一个新闻为感兴趣的新闻。
可选的,在第一方面的一种可能的实现方式中,对所有新闻进行去重处理,得到第一新闻集合,包括:对所述所有新闻中的每一个新闻进行特征提取,并根据所述提取的每个新闻的特征,确定所述第一新闻集合。
可选的,在第一方面的另一种可能的实现方式中,对所述第一新闻集合进行筛选,得到第二新闻集合,包括:对所述第一新闻集合中的每个新闻进行关键词提取;筛选符合所述关键词的至少一个新闻,生成所述第一新闻集合。
可选的,在第一方面的又一种可能的实现方式中,对所述第一新闻集合进行筛选,得到第二新闻集合,包括:配置预训练的语言模型;利用所述预训练的语言模型对用户感兴趣的新闻进行召回,生成所述第二新闻集合。
可选的,在第一方面的又一种可能的实现方式中,利用所述预训练的语言模型对用户感兴趣的新闻进行召回,生成所述第二新闻集合,包括:利用所述预训练的语言模型获得符合需求的新闻特征;将所述符合需求的新闻特征与所述第一新闻集合中每个新闻的新闻特征进行相似度对比,确定所有相似度大于等于阈值的新闻;将所有相似度大于等于阈值的新闻组合,生成所述第二新闻集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国长江三峡集团有限公司;上海勘测设计研究院有限公司;三峡高科信息技术有限责任公司,未经中国长江三峡集团有限公司;上海勘测设计研究院有限公司;三峡高科信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210887401.8/2.html,转载请声明来源钻瓜专利网。