[发明专利]多维度高度可定制的新闻聚合方法在审
申请号: | 202010732996.0 | 申请日: | 2020-07-27 |
公开(公告)号: | CN111881277A | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 张国卫;李学江;郑有为 | 申请(专利权)人: | 新华智云科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/338;G06F16/34;G06F16/9535 |
代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 姚宇吉 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多维 高度 定制 新闻 聚合 方法 | ||
本发明公开了一种多维度高度可定制的新闻聚合方法,包含:获取若干网络媒体的新闻文献;对每一份新闻文献进行预处理;对每一份新闻文献进行结构化处理以定义新闻文献的多个检索字段;将结构化处理后的新闻文献存入数据库并构建索引;接收用户的配置信息,配置信息包含至少一个检索字段限定;根据用户设定的配置信息从数据库中检索符合条件的新闻文献;将匹配到的新闻文献发送至用户。本发明的有益之处在于提供的多维度高度可定制的新闻聚合方法,将多个网络媒体的新闻文献数据都聚集在一起进行结构化,定义新闻文献的检索字段,用户可以根据这些检索字段进行自定义配置,设定自己关注的新闻。
技术领域
本发明涉及一种多维度高度可定制的新闻聚合方法。
背景技术
新闻聚合是指收集互联网各类媒体、网站(如今日头条、人民网、新华网等)的新闻和消息,然后以某种方式过滤筛选后呈现终端用户。
现有的新闻聚合的例子如各大资讯类app:今日头条、一点资讯、腾讯新闻和网易新闻等,主要提供了频道或者栏目订阅的功能,用户订阅后,可以进到相应栏目中查看相关的新闻。但只能查看订阅的该app下的文章,因此,数据来源不够丰富,预定的频道或者栏目粒度较粗,且不能自定义。
发明内容
为解决现有技术的不足,本发明提供了一种可以解决上述问题的多维度高度可定制的新闻聚合方法。
为了实现上述目标,本发明采用如下的技术方案:
一种多维度高度可定制的新闻聚合方法,包含以下步骤:
获取若干网络媒体的新闻文献;
对每一份新闻文献进行预处理;
对每一份新闻文献进行结构化处理以定义新闻文献的多个检索字段;
将结构化处理后的新闻文献存入数据库并构建索引;
接收用户的配置信息,配置信息包含至少一个检索字段限定;
根据用户设定的配置信息从数据库中检索符合条件的新闻文献;
将匹配到的新闻文献发送至用户。
进一步地,对每一份新闻文献进行结构化处理以定义新闻文献的多个检索字段的具体方法为:
提取新闻文献的文献来源、关键词和实体信息;
分析新闻文献得到新闻文献的情感指数和业务领域标签;
将文献来源、关键词、实体信息、情感指数和业务领域标签关联至对应的新闻文献将其作为新闻文献的检索字段。
进一步地,当网络媒体是社交媒体时,提取出的文献来源还包含发布账号;
用户在配置文献来源字段时,可以针对社交媒体设定若干具体的发布账号。
进一步地,关键词包含标题关键词和正文关键词;
用户在配置关键词字段时可以分别设定标题关键词字段和正文关键词字段。
进一步地,对每一份新闻文献进行结构化处理以定义新闻文献的多个检索字段的具体方法还包括:
分析新闻文献得到新闻文献的信息摘要;
提取信息摘要的摘要关键词并将摘要关键词关联至对应的新闻文献将其作为新闻文献的检索字段;
用户在配置关键词字段时可以分别设定标题关键词字段、正文关键词字段和摘要关键词字段。
进一步地,实体信息包含主要实体和次要实体;
用户在配置实体信息字段时可以分别设定主要实体字段和次要实体字段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华智云科技有限公司,未经新华智云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010732996.0/2.html,转载请声明来源钻瓜专利网。