[发明专利]基于ID相似性识别的电商评价鉴别系统在审
申请号: | 201510250996.6 | 申请日: | 2015-05-16 |
公开(公告)号: | CN104867019A | 公开(公告)日: | 2015-08-26 |
发明(设计)人: | 吴雨浓;何宏靖;刘世林 | 申请(专利权)人: | 成都数联铭品科技有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都市高新*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 id 相似性 识别 评价 鉴别 系统 | ||
技术领域
本发明涉及互联网领域,特别涉及基于ID相似性识别的电商评价鉴别系统。
背景技术
在当代,随着互联网的普及,电子商务已经成为一种被广泛利用的商业贸易方式。买卖双方主要是通过电商的网页或者是软件进行交易活动。由于电子商务没有传统的实体店面,对销售人员的数量要求也不高,所以相比传统交易模式更能够控制运营成本,因而有着更大的价格优势。但是,有很多不法商家为了提高自己的销量从而雇佣专业刷评价团队也制造大量的虚假评价来对自己的商品进行虚假的宣传,从而欺骗消费者来提高自己的真实销量。
目前电子商务的发展迅猛,体量巨大,电商环境中的卖家数量众多,用户在进行购买决定时难以判断商品描述的真实性,对商品评价的依赖度很高,由于卖家评价作弊而造成的商品的性能好评度虚高的情况引起的买家利益损失的情况严重。在这样的情况下,如何对电子商务中商家的评价作弊行为进行识别和判断成电子商务发展过程中亟待解决的问题;在判断虚假评价过程中如何提高判断的准确性,避免误判情况的发生也是十分重要的考量因素;目前现有技术中还缺乏准确有效的相关设备来实现相关的判断。
发明内容
为了解决现有技术中存在的问题,本发明提供了基于ID相似性识别的电商评价鉴别系统,通过ID相似性判断模块来识别目标商品评价数据中的相同和相似评价ID;并且在判断出相同和相似ID的基础上通过ID作弊因子判断模块,来鉴别出这些相同或者相似评价ID为作弊ID的可能性,进而判断出专业刷评价人员所给出的大量虚假评价;并且本基于ID相似性识别的电商评价鉴别系统还通过虚假评价标记模块将通过ID作弊因子判断模块所判断出的虚假ID以及所对应的评价内容进行标记,这样实现了目标商品评价中虚假评价的自动识别,为电商环境管理者和商品消费者提供了简单可靠的评价辨识工具。
为了实现上述发明目的,本发明提供了以下技术方案:
基于ID相似性识别的电商评价鉴别系统;包括客户机、网络连接装置、ID相似性判断模块、ID作弊因子判断模块以及虚假评价标记模块;其中所述客户机一端通过网络连接装置来获取目标商品的相关评价数据信息(目前通过爬虫技术可以很方便的获取到目标网页中的相关信息,提取的速度快,可分析数据的总量巨大,所提取数据的分析方法成熟,成本低廉);所述客户机的另一端与所述ID相似性判断模块的输入端相连,所述ID相似性判断模块的输出端与所述ID作弊因子判断模块的输入端相连。所述客户机将获取到的目标商品评价信息输出到所述ID相似性判断模块中,所述ID相似性判断模块通过文本相似性来判断出这些评价ID是否相同或者相似,并将判断出结果(相同或者相似ID)输入到ID作弊因子判断模块中;如果这些ID所发出评价的频率高于阈值,所述ID作弊因子判断模块则将这些ID判断为虚假评价ID。
目前如果商家想要通过虚假交易和评价来提高系统显示商品的销量和好评情况,所需要的虚假评价的数量较大,在这样的情况下;职业刷评价团队会人工或者利用自动注册机来注册很多小号(所谓的小号是指,同一个人注册和使用的不同的ID号),这些职业评价团队所注册和使用的小号ID具有一定规律性;一般情况下职业评价师所注册的一系列ID号也是根据系统推荐或者自动生成的,这样的方式所产生的ID号会具有较大的关联性和相似性,比如说ABC1、ABC2、ABC3、ABC4、ABC5.....ABCn。通过对评价ID的文本相似性比较就可以判断出相同或者相似评价内容所对应的评价ID是否相同或者相似;如果ID相同或者相似,那么这些ID为虚假ID的可能性很高。
为了进一步提高虚假评价判断的准确性,使判断的结果更加严格,所述ID相似性判断模块将判断结果输入到所述ID作弊因子判断模块中;所述ID作弊因子判断模块在判断出的相同或者相似ID的基础上,分析对应ID发出评价的频率和时间,将对应ID发出评价的频率与目标商品评价的平均评价频率进行比较,如果其比值高于设定的阈值,则将这些评价ID判断为虚假评价ID,通过本系统所判断虚假评价的过程严格,判断结果准确性高。
作为一种优选,所述ID相似性判断模块为相似评价ID判断服务器;所述ID作弊因子判断模块为作弊因子判断服务器。所述相似评价内容判断服务器、相似评价ID判断服务器以及作弊因子判断服务器通过数据连接线依次相连。服务器在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面表现优秀,通过服务器来完成相关的内容相似性,ID相似性的相关判断,可快速处理大量电商目标商品的相关数据,处理速度快,效率高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数联铭品科技有限公司,未经成都数联铭品科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510250996.6/2.html,转载请声明来源钻瓜专利网。