[发明专利]一种针对商家的扰乱性评论的识别方法及系统有效
申请号: | 202111188290.3 | 申请日: | 2021-10-12 |
公开(公告)号: | CN113641798B | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 王思宇;江岭;黄鹏 | 申请(专利权)人: | 成都晓多科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/04;G06Q30/02 |
代理公司: | 成都睿道专利代理事务所(普通合伙) 51217 | 代理人: | 薛波 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 商家 扰乱 评论 识别 方法 系统 | ||
本发明提供一种针对商家的扰乱性评论的识别方法及系统,包括:获取商家的类别信息和属性信息;根据类别信息从预设的类别嵌入矩阵中获取商家各个所属类别的表示向量,并计算商家所有类别的表示向量的平均值,得到商家的类别特征向量;根据属性信息从预设的词嵌入矩阵中获取商家属性值的表示向量,并计算商家属性值的表示向量中所有字符向量的平均值,得到商家的属性特征向量;将类别特征向量和属性特征向量进行拼接得到商家特征向量;获取用户做出的评论并通过层次注意力模型处理得到评论对应的评论表示向量;将商家特征向量和评论表示向量映射到匹配空间计算得到匹配概率,并根据匹配概率识别出扰乱性评论;识别扰乱性评论的同时降低了人工成本。
技术领域
本发明涉及电子商务技术领域,具体而言,涉及一种针对商家的扰乱性评论的识别方法及系统。
背景技术
用户在购买商品后很多时候都会根据自己的使用体验发表评论信息,因此评论信息对商家或是用户都有很高的利用价值。但是网络上涌现了大量的虚假评论,对商家和用户的体验都造成了极大的影响。这些虚假评论主要分为以下三种:(1)不真实评论((Untruthful Opinions):这些评论来自别有用心的群体,他们企图通过评论美化自身产品和服务,或恶意攻击竞争对手;(2)笼统评论(Reviews on Brands Only):这类评论通常不直接评论所购买的产品或服务,而是对服务或商品笼统的描述为:为我喜欢这个品牌或这个地方等。(3)非评论(Non-Reviews):这类评论内容中不包括具体的评论信息,更多的是广告或者闲聊。其中,类型(2)和(3)统称为扰乱性评论(disruptive opinion),类型1称之为欺诈性评论(deceptive opinion)。欺诈性评论对用户和商家的危害极大,因此学术界和工业界目前已经进行了大量的研究。扰乱性评论相对来说,对于商家和用户威胁较少,因为一般人可以非常容易识别到这类信息。但是,如果一个商品页面充斥较多这样的评论会极大的影响用户体验。为了识别扰乱性评论,目前很多方法都是通过特征抽取与机器学习来实现,但是因为在线评论的内容长短不一、用语不规范、大量社会化内容等问题,采用上述方式进行识别的难度和人工标注成本都很高。因此,需要提供一种方案以便于高效识别扰乱性评论的同时降低人工成本。
发明内容
本发明的目的在于提供一种针对商家的扰乱性评论的识别方法及系统,用以实现高效识别扰乱性评论的同时降低人工成本的技术效果。
第一方面,本发明提供了一种针对商家的扰乱性评论的识别方法,包括:
S1.获取商家的类别信息和属性信息;所述类别信息包括商家能够划分为的多种类别;所述属性信息包括商家的名称和地址;
S2.根据所述类别信息从预设的类别嵌入矩阵中获取商家各个所属类别的表示向量,并计算商家所有类别的表示向量的平均值,得到商家的类别特征向量;
S3.根据所述属性信息从预设的词嵌入矩阵中获取商家属性值的表示向量,并计算商家属性值的表示向量中所有字符向量的平均值,得到商家的属性特征向量;
S4.将所述类别特征向量和所述属性特征向量进行拼接得到商家特征向量;
S5.获取用户做出的评论并通过层次注意力模型处理得到所述评论对应的评论表示向量;
S6.将所述商家特征向量和所述评论表示向量映射到匹配空间计算得到匹配概率,并根据所述匹配概率识别出扰乱性评论;其中,匹配概率的计算方式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都晓多科技有限公司,未经成都晓多科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111188290.3/2.html,转载请声明来源钻瓜专利网。