[发明专利]一种信息处理方法及装置有效
申请号: | 201810068768.0 | 申请日: | 2018-01-24 |
公开(公告)号: | CN108446296B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 张轩玮 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35;G06F40/289;G06F40/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 | ||
本发明实施例提供了一种信息处理方法及装置,所述方法包括:获取热点事件标签和多个事件报道;计算所述热点事件标签与所述多个事件报道的第一文本相似度,以及,计算所述多个事件报道之间的第二文本相似度,以及,获取所述多个事件报道的时效特征值;根据所述第一文本相似度、所述第二文本相似度和所述时效特征值,计算所述多个事件报道的最大边缘相关值;按照所述多个事件报道的最大边缘相关值聚合所述多个事件报道,得到报道聚合结果。根据本发明实施例,节省了用户获取具有多样性、时效性的事件报道的时间和精力。
技术领域
本发明涉及信息处理领域,特别是涉及一种信息处理方法,以及,一种信息处理装置,以及,一种移动终端,以及,一种计算机可读存储介质。
背景技术
目前,越来越多的用户通过互联网关注资讯,尤其是对当前热点事件的关注。
通常,用户可以针对热点事件的事件报道进行搜索得到相关的事件报道,或者,由网站运营商将热点事件的事件报道推荐给用户。在搜索事件报道或推荐事件报道时,需要将大量的事件报道进行聚合,将聚合结果作为搜索结果或者推荐结果发送给用户。
然而,目前的事件报道聚合方式中,仅考虑了事件报道与热点事件的关联性,导致所聚合的多个事件报道中重复内容过多,而且,所聚合的事件报道可能已经过期。而通过上述的事件报道聚合方式,可能将大量重复、过期的事件报道提供给用户,用户还需要花费时间和精力从中筛选,以满足其对事件报道的多样性、时效性等方面的需求。
因此,现有技术的事件报道聚合方式存在着耗费用户时间和精力的问题。
发明内容
本发明实施例针对所要解决的技术问题提供了一种信息处理方法,以及,一种信息处理装置。
为了解决上述问题,本发明提供了一种信息处理方法,所述方法包括:
获取热点事件标签和多个事件报道;
计算所述热点事件标签与所述多个事件报道的第一文本相似度,以及,计算所述多个事件报道之间的第二文本相似度,以及,获取所述多个事件报道的时效特征值;
根据所述第一文本相似度、所述第二文本相似度和所述时效特征值,计算所述多个事件报道的最大边缘相关值;
按照所述多个事件报道的最大边缘相关值聚合所述多个事件报道,得到报道聚合结果。
可选地,所述热点事件标签具有对应的第一文本向量,所述计算所述热点事件标签与所述多个事件报道的第一文本相似度的步骤,包括:
从所述多个事件报道中选取待评价事件报道;
对所述待评价事件报道进行分词处理,得到多个报道分词文本;
计算所述多个报道分词文本的第二文本向量;
计算所述第一文本向量和所述第二文本向量的余弦值,作为所述第一文本相似度。
可选地,所述事件报道具有N个,N个事件报道中包括M个已评价事件报道,0<M<N,所述已评价事件报道具有对应的第三文本向量,所述计算所述多个事件报道之间的第二文本相似度的步骤,包括:
计算所述待评价事件报道的第二文本向量与所述M个已评价事件报道的第三文本向量的M个余弦值;
在所述M个余弦值中提取最大余弦值,作为所述第二文本相似度。
可选地,所述热点事件标签具有事件时间,所述事件报道具有报道时间,所述获取所述多个事件报道的时效特征值的步骤,包括:
计算所述待评价事件报道的报道时间与所述热点事件标签的事件时间的时间间隔值;
采用所述时间间隔值和预设的时效衰减值,计算所述待评价事件报道的时效特征值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810068768.0/2.html,转载请声明来源钻瓜专利网。