[发明专利]头版新闻预测分类方法有效
申请号: | 202010845229.0 | 申请日: | 2020-08-20 |
公开(公告)号: | CN112100372B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 曹开臣;戴礼灿;孙文;陈明仁;蔡世民 | 申请(专利权)人: | 西南电子技术研究所(中国电子科技集团公司第十研究所) |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/215;G06F40/289;G06F40/284;G06F16/951;G06K9/62 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 刘世权 |
地址: | 610036 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 头版 新闻 预测 分类 方法 | ||
本发明公开的一种头版新闻预测分类方法,旨在一种能够兼顾局部中心性和全局中心,并能表现出较好头版新闻预测结果的新闻预测分类方法。本发明通过下述技术方案实现:首先通过用户界面输入要查询的关键字,在互联网上搜集网页,将搜集到的网页新闻文本信息保存到本地数据库;文本表征模块利用Doc2Vec表征算法进行向量表征,将每一篇新闻文本各自转化为低维、高信息量的文本特征向量;相似性网络构建模块计算新闻间的相似度,根据计算所得的相似矩阵视为新闻相关网络的邻接矩阵,构建出新闻相似性网络,遍历完相似性网络,是则根据支持H‑指数贡献矩阵迭代计算向量HR值,利用HR值对新闻进行权重排序,预测top‑N条新闻作为头版新闻。
技术领域
本发明涉及自然语言处理、人工智能预测分类领域,具体涉及一种报刊的头版新闻智能预测方法。
技术背景
新闻媒介具有传播信息、政治宣传、普及教育、舆论监督、社会服务、文化娱乐等多方面功能。这些功能的发挥都要通过具体的新闻报道来实现,因此报道效果目标也相应呈多元化的形态。如通过报道宣传某种政策、观念或主张;通过批评报道揭露社会弊端,促进问题的解决;通过追踪报道传播最新信息、监视社会环境;通过活动策划与新闻报道的结合,为社会公众提供服务、娱乐,或进行道德教育、解决社会问题,或塑造报纸形象,扩大社会影响等。权威报刊的头版新闻通常报道与国家政治、经济政策相关的重要信息,代表国家政治、外交、经济政策的发展方向,特别是其头版新闻在不同时期对国家政治、经济政策有着决定性的指导作用,被外界作为分析各国政治、经济政策变化的渠道之一。因此,正确预测国家级报刊的头版新闻对判断国家政策变化具有重要意义。
信息技术的快速增长带动了生活的网络化,生活中存在各种各样的网络:在线社交网络、科研网络以及交通网络等。社会网络是人们通过各种关系建立起来的联系,并通过成员之间的交互作用形成的一种网络化结构。社会网络分析法就是对于社会网络的关系结构或者属性进行分析,行动者可以是人、社区或者群体等,他们之间的关系能够反映出一定的现象或者数据。其中诸多数据可以表示为二元图G=(V,E),其中的V表示研究的成员集合,E是成员之间的关系的集合。社会网络的一个突出的特点是存在少数的关键节点,这类节点对研究网络的功能和保持网络的稳定性具有重要的作用。例如网络在遭受外界蓄意攻击时,关键节点遭到攻击就会导致整个的网络瘫痪。网络节点重要(中心)性排序是亟待解决的问题,这对处理信息流,预防传染性的传播以及网络上的其他重要的行为具有非常重要的意义。
在自然界中存在的大量复杂系统都可以通过不同的复杂网络加以描述。一个典型的复杂网络是由许多节点与节点之间的连边组成,其中节点用来代表真实系统中不同的个体,而连边则用来表示个体间的关系。新闻媒体即为不同的新闻互相连接形成的新闻网络。在复杂网络领域的研究中,节点的核心地位确定是极其重要的。其应用包括识别社交网络中最有影响力的人,互联网或城市网络中的关键基础设施节点以及疾病的超级传播者。中心性概念最早是在社交网络分析中开发的,许多用于衡量中心性的术语都反映了它们的社会学渊源。中心性指数就是对节点核心地位的定量刻画,借此反应该节点在网络中的重要性。而“重要性”一词有很多含义,导致对中心性的许多不同定义,目前主要有两种不同的解释。“重要性”可以被认为与网络上的流或传输类型有关,这使得中心性可以根据在资源分配过程中对节点的依赖程度进行定义。“重要性”也可以被认为是节点对网络凝聚力的贡献情况,这使得中心性也可以通过衡量节点对网络凝聚力贡献的程度进行定义。通过研究网络节点中心性的方式研究权威报刊头版新闻的成因,可以从直观的角度给出一个假设来解释头版新闻的成因,即“在新闻网络中,新闻的中心性越大,其成为头版新闻的可能性就高”。因此,利用预测新闻网络节点中心性来实现头版新闻的预测分类是具有较大研究价值的。
发明内容
本发明的任务是提供一种能够兼顾局部中心性和全局中心,并能表现出较好头版新闻预测结果的头版新闻预测分类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南电子技术研究所(中国电子科技集团公司第十研究所),未经西南电子技术研究所(中国电子科技集团公司第十研究所)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010845229.0/2.html,转载请声明来源钻瓜专利网。