[发明专利]在线评论筛选装置在审
申请号: | 202010485097.5 | 申请日: | 2020-06-01 |
公开(公告)号: | CN111639172A | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 张成洪;陈刚;肖帅勇 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06F16/33;G06F40/284 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 卢泓宇 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 在线 评论 筛选 装置 | ||
本发明提供一种在线评论筛选装置,用于从用户针对评论对象进行评论形成的大量在线评论文本中筛选出能够代表所有在线评论文本的整体评论内容的代表性评论,其特征在于,包括:在线评论获取部,获取评论对象的多个在线评论文本并向量化形成相应的多个文本向量;评论文本聚类部,对文本向量进行聚类从而得到由相同类型的文本向量以及在线评论文本构成的多个评论簇;文本向量合成部,在每个评论簇中依次将评论对象对应的所有文本向量合成为新的文本向量;权重训练部,对评论簇进行权重训练从而对各个评论簇进行加权形成加权评论簇;以及代表性评论抽取部,对加权评论簇进行概率抽样并将抽取得到的在线评论文本作为代表性评论文本。
技术领域
本发明属于语义识别领域,具体涉及一种在线评论筛选装置。
背景技术
大数据时代,线上交易平台的大量评论数据为顾客的线上购买决策提供了有力支撑,这些评论方便了用户更客观地了解到各个线上店铺或是商品的描述与实际情况是否一致,从而有助于用户在线上交易这类无法确认实物的情况下购买到与期望相符的商品或是服务。
然而,随着店铺的消费者以及店铺运营时间的增加,会不断地产生新的线上评论并导致评论被大量的积累,此时,后续的用户在判断商品的好坏时就需要翻阅大量的评论或是仅仅翻阅部分的评论,这样就使得用户难以在短时间内完整地了解所有评论的整体内容,容易导致忽略了一些关键的评论而进行了不符合期望的交易。
现在的线上交易平台通常会在让用户进行评论的同时进行打分,并统计各个线上店铺或是商品总体的评分,从而在一定程度上客观地反应线上店铺或是商品的好坏。但是,由于每个用户对评分的判断标准不统一,因此评分实际并不能为用户提供准确的判断,同时也可能存在刷单等行为造成误判,远远不如用户根据各个线上评论所做出判断更具有准确性。
发明内容
为解决上述问题,提供一种从所有在线评论中筛选出具有代表性和多样性的最能反映商品历史情况的有用评论的在线评论筛选装置,本发明采用了如下技术方案:
本发明提供了一种在线评论筛选装置,用于从用户针对评论对象进行评论形成的大量在线评论文本中筛选出能够代表所有在线评论文本的整体评论内容的代表性评论,其特征在于,包括:在线评论获取部,获取评论对象的多个在线评论文本并向量化形成相应的多个文本向量;评论文本聚类部,通过稀疏聚类方法对文本向量进行聚类从而得到由相同类型的文本向量以及在线评论文本构成的多个评论簇,每个评论簇对应一种评论类型;文本向量合成部,获取评论簇中评论对象对应的文本向量,并在每个评论簇中依次将评论对象对应的所有文本向量按到聚类中心的距离进行加权平均从而合成为新的文本向量,使得评论对象在每个评论簇中对应且只对应一个文本向量;权重训练部,通过预定的权重训练方法对评论簇进行权重训练从而对各个评论簇进行加权形成加权评论簇;以及代表性评论抽取部,根据预设的样本抽取比例对加权评论簇进行概率抽样并将抽取得到的在线评论文本作为代表性评论文本。
本发明提供的在线评论筛选装置,还可以具有这样的技术特征,还包括:画面存储部;以及输入显示部,其中,画面存储部存储有评论显示画面,评论显示画面包含有用于显示在线评论文本的一般评论显示部分以及用于显示代表性评论的代表性评论显示部分,输入显示部在显示评论显示画面并在一般评论显示部分中显示店铺的在线评论文本时,还同时在代表性评论显示部分中显示代表性评论从而让用户根据该代表性评论了解所有在线评论文本的内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010485097.5/2.html,转载请声明来源钻瓜专利网。