[发明专利]对评论进行排序的方法和装置及机器可读存储介质有效
申请号: | 201910324798.8 | 申请日: | 2019-04-22 |
公开(公告)号: | CN111859946B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 张琳琳;崔燕;岳爱珍;翟庆羽;宋烈金 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/957;G06F16/903 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 肖冰滨;王晓晓 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评论 进行 排序 方法 装置 机器 可读 存储 介质 | ||
本发明实施例提供一种对评论进行排序的方法和装置及机器可读存储介质,属于文本处理技术领域。该方法包括:确定至少一个评论中每一评论的内容质量参数和时间影响因子;基于所述至少一个评论中的每一评论的所述内容质量参数和所述时间影响因子确定该评论的评分;以及基于所述至少一个评论中的每一评论的评分对所述至少一个评分进行排序。藉此,实现了对评论进行排序,并且在对评论进行排序时同时考虑了评论的内容质量和发表时间,实现了在对评论进行排序时既能将有价值的优质评论展现给客户又能保证评论的时效性。
技术领域
本发明涉及文本处理技术领域,具体地涉及一种对评论进行排序的方法和装置及机器可读存储介质。
背景技术
随着互联网信息的不断增长,以往的信息缺乏消失了,但海量的数据造成的后果是数据质量的参差不齐。因此人们也越来越渴望能快速地在数据汪洋中寻找有内容对自己有价值的数据,即便捷的获取优质内容。对于电子商务来说,消费者希望能从众多的商品评论中通过客观真实的高质量评论获得对商品的认识,进而决定是否购买,商家则希望从中获得市场对商品的看法,从而更好地适应用户的需求。信息过载与数据质量良莠不齐的矛盾出现在越来越多的产品场景,比如博客、微博、论坛和百度口碑等网络信息聚合地,通过一种合理的排序方法将海量数据进行重新排序,将优质内容优先展现给网民是提升用户体验,最大化内容价值的关键。
目前对文本评论进行排序的方法主要包括:(1)按时间顺序,包括按时间顺序正排或者倒排;(2)按评论内容质量,即将文本质量较高的评论排在前面。文本评论排序是提升用户体验,提升海量内容价值的关键手段,是自然语言处理的一个重要分支。
现有方法主要有以下几个局限性:(1)按时间顺序正排导致前端展现的评论都是历史评论,如果时间跨度比较大,对用户参考价值不大;而按时间顺序倒排虽然可以保证用户优先看到的是最新评论,但并不能保证质量最优;因此,按照时间排序不能保证优先展现给用户的都是有价值的优质评论;(2)按评论内容质量排序,虽然可以保证文本质量高的排在前面,但是可能排在前面的一直是质量比较高的特定评论,如果评论时间比较久的话对用户价值也不大,不能保证评论的时效性。
发明内容
本发明的目的是提供一种对评论进行排序的方法和装置及机器可读存储介质,其可解决或至少部分解决上述问题。
为了实现上述目的,本发明的一个方面提供一种用于对评论进行排序的方法,该方法包括:确定至少一个评论中每一评论的内容质量参数和时间影响因子;基于所述至少一个评论中的每一评论的所述内容质量参数和所述时间影响因子确定该评论的评分;以及基于所述至少一个评论中的每一评论的评分对所述至少一个评分进行排序。
可选地,确定所述至少一个评论中每一评论的内容质量参数包括:确定所述至少一个评论中每一评论的情感分值、语句混乱度和文本丰富度;以及基于所述至少一个评论中每一评论的所述情感分值、所述语句混乱度和所述文本丰富度确定该评论的所述内容质量参数。
可选地,所述基于所述至少一个评论中每一评论的所述情感分值、所述语句混乱度和所述文本丰富度确定该评论的所述内容质量参数包括基于以下内容确定该评论所述内容质量参数:针对所述至少一个评论中每一评论,所述内容质量参数与所述情感分值和所述文本丰富度成正相关,所述内容质量参数与所述语句混乱度成负相关。
可选地,确定所述至少一个评论中每一评论的所述情感分值包括:针对所述至少一个评论中每一评论,确定包含情感的句子在该评论中的占比,其中所述占比即为该评论的所述情感分值。
可选地,确定所述至少一个评论中每一评论的所述语句混乱度包括:针对所述至少一个评论中每一评论,基于预设转移概率矩阵确定该评论中相邻词之间的转移概率;以及基于以下公式确定所述语句混乱度:其中,entropy_score表示所述语句混乱度,n表示该评论中词的个数,prob(i)表示词i相邻的前一词转移到词i的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910324798.8/2.html,转载请声明来源钻瓜专利网。