[发明专利]在线评论筛选装置在审
申请号: | 202010485097.5 | 申请日: | 2020-06-01 |
公开(公告)号: | CN111639172A | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 张成洪;陈刚;肖帅勇 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06F16/33;G06F40/284 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 卢泓宇 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 在线 评论 筛选 装置 | ||
1.一种在线评论筛选装置,用于从用户针对评论对象进行评论形成的大量在线评论文本中筛选出能够代表所有所述在线评论文本的整体评论内容的代表性评论,其特征在于,包括:
在线评论获取部,获取所述评论对象的多个在线评论文本并向量化形成相应的多个文本向量;
评论文本聚类部,通过稀疏聚类方法对所述文本向量进行聚类从而得到由相同类型的所述文本向量以及所述在线评论文本构成的多个评论簇,每个所述评论簇对应一种评论类型;
文本向量合成部,获取所述评论簇中所述评论对象对应的文本向量,并在每个所述评论簇中依次将所述评论对象对应的所有所述文本向量按到聚类中心的距离进行加权平均从而合成为新的文本向量,使得所述评论对象在每个评论簇中对应且只对应一个文本向量;
权重训练部,通过预定的权重训练方法对所述评论簇进行权重训练从而对各个所述评论簇进行加权形成加权评论簇;以及
代表性评论抽取部,根据预设的样本抽取比例对所述加权评论簇进行概率抽样并将抽取得到的所述在线评论文本作为所述代表性评论文本。
2.根据权利要求1所述的在线评论筛选装置,其特征在于,还包括:
画面存储部;以及
输入显示部,
其中,所述画面存储部存储有评论显示画面,
所述评论显示画面包含有用于显示所述在线评论文本的一般评论显示部分以及用于显示所述代表性评论的代表性评论显示部分,
所述输入显示部在显示所述评论显示画面并在所述一般评论显示部分中显示所述店铺的所述在线评论文本时,还同时在所述代表性评论显示部分中显示所述代表性评论从而让所述用户根据该代表性评论了解所有所述在线评论文本的内容。
3.根据权利要求1所述的在线评论筛选装置,其特征在于,还包括:
画面存储部,存储有评论查询画面;以及
输入显示部,
其中,所述评论查询画面包括评论对象选定部分、筛选参数输入部分以及查询评论显示部分,
所述输入显示部显示所述评论查询画面并显示所述评论对象选定部分让所述用户选定至少一个需要查看的评论对象作为待查询对象,同时显示所述筛选参数输入部分让用户输入用于调整所述代表性评论的抽取数量的筛选参数,
一旦所述用户确认了所述待查询对象的选定以及所述筛选参数的输入,所述代表性评论抽取部就将所述筛选参数作为所述样本抽取比例并对所述加权评论簇进行概率抽样,进一步将抽取得到的所述待查询对象的所述在线评论文本作为查询用代表性评论,
一旦所述代表性评论抽取部抽取到所述查询用代表性评论,所述输入显示部就在所述评论查询画面中显示所述查询评论显示部分并显示与所述查询用代表性评论从而让所述用户根据该查询用代表性评论了解所述待查询对象的所有所述在线评论文本的内容。
4.根据权利要求1所述的在线评论筛选装置,其特征在于:
其中,所述稀疏聚类方法为:
subject to||w||2≤1,||w||1≤s,
式中,p为所述文本向量的集合中特征向量的个数,d为欧氏距离,n为聚类个数,i,i’是不同所述文本向量的标号,j是所述特征向量的标号,Ck为第k个所述评论簇,w、wj为特征权重。
5.根据权利要求1所述的在线评论筛选装置,其特征在于:
其中,所述权重训练方法为组正则化稀疏模型:
式中,n为所述在线评论文本的个数,m为所述评论簇的个数,λ为特征稀疏的惩罚参数,α为用于调节组间稀疏和组内稀疏的力度,X(l)为第l个所述评论簇的所述文本向量,β为特征系数,
训练出所述组正则化稀疏模型后,将所述特征系数的绝对值进行归一化即得到每个所述评论簇的权重。
6.根据权利要求1所述的在线评论筛选装置,其特征在于:
其中,所述评论对象为店铺,
所述权重训练指标为所述店铺的历史销售情况,
所述评论类型为卫生、周边环境、设施、交通、早餐、价格、服务态度中的任意多种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010485097.5/1.html,转载请声明来源钻瓜专利网。