[发明专利]一种文章的评论处理方法及系统有效
申请号: | 201810228116.9 | 申请日: | 2018-03-20 |
公开(公告)号: | CN108509545B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 张航;陈超;何海乾;曾镇 | 申请(专利权)人: | 北京云站科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100195 北京市海淀区四季青*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文章 评论 处理 方法 系统 | ||
本申请公开了一种文章的评论处理方法及系统,方法包括:获得目标文章的评论信息;获得与所述目标文章相对应的目标相似文章;将所述评论信息写入所述目标相似文章的评论列表中。本申请中通过将相同或相似文章的评论互相写入对方的评论列表,来实现评论在相同或相似文章中共享,从而用户在当前平台上同样能够阅读到其他平台上的网友评论,由此为用户提供更丰富的阅读内容,改善用户阅读体验。
技术领域
本申请涉及数据处理技术领域,特别涉及一种文章的评论处理方法及系统。
背景技术
随着互联网的普及,网络上的文章越来越多,如电影评论文章或时事点评文章等,既有原创的文章,也有转载或二次编辑的文章。为了满足人们的互动需求,网站会允许网友对文章添加评论,如对某篇文章上传自己的观点等等。
由于一篇文章可能会在不同的平台上发布,相应的,在不同的平台上有相应的评论。
这些评论之间因为文章发布平台的不同无法共享,处于当前平台的网友无法看到其他平台上文章的评论内容,因此,会对网友的阅读体验造成影响。
发明内容
有鉴于此,本申请的目的在于提供一种文章的评论处理方法及系统,用以解决现有技术中文章在不同的发布平台上无法共享不同平台上所产生的评论,导致网友阅读体验较差的技术问题。
本申请提供了一种文章的评论处理方法,包括:
获得目标文章的评论信息;
获得与所述目标文章相对应的目标相似文章;
将所述评论信息写入所述目标相似文章的评论列表中。
上述方法,优选地,获得与所述目标文章相对应的目标相似文章,包括:
获得所述目标文章所对应的目标映射关系,所述映射关系为文章标识与文章所属聚簇标识的映射关系,一篇所述文章仅属于一个所述聚簇,一个所述聚簇中包含多篇所述文章;
根据所述目标映射关系,获得所述目标文章所属的目标聚簇及所述目标聚簇中所包含的目标相似文章。
上述方法,优选地,所述映射关系通过以下方式获得:
获得待处理文章集合,所述待处理文章集合中包括多篇待处理文章;
对所述待处理文章的文章标题进行分词处理,得到至少一个标题分词及其权重;
对于所述待处理文章,查找每个所述标题分词所关联的聚簇标识列表,所述聚簇标识列表中包括至少一个聚簇标识;
如果查找到所述标题分词所关联的聚簇标识列表,获得所述聚簇标识列表之间所含有的相同的交集聚簇标识,如果没有查找到,生成新的聚簇标识并建立所述待处理文章的文章标识与所述新的聚簇标识的映射关系;
在获得所述聚簇标识列表之间所含有的相同的交集聚簇标识后,获得所述交集聚簇标识所对应的关联文章及其分词;
基于所述分词的权重,计算所述关联文章的分词与所述标题分词之间的相似度值;
如果所述相似度值满足预设的阈值范围,建立所述待处理文章的文章标识与交集聚簇标识的映射关系,如果所述相似度值不满足所述阈值范围,返回执行所述生成新的聚簇标识并建立所述待处理文章的文章标识与所述新的聚簇标识的映射关系。
上述方法,优选地,基于所述分词的权重,计算所述关联文章的分词与所述标题分词之间的相似度值,包括:
根据所述分词的权重,计算所述关联文章的分词与所述标题分词之间的余弦值作为相似度值。
上述方法,优选地,获得待处理文章集合,包括:
获得预设时长内未进行处理的文章组成待处理文章集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云站科技有限公司,未经北京云站科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810228116.9/2.html,转载请声明来源钻瓜专利网。