[发明专利]网购用户买假指数模型的生成方法及系统在审
申请号: | 201810238533.1 | 申请日: | 2018-03-21 |
公开(公告)号: | CN108428156A | 公开(公告)日: | 2018-08-21 |
发明(设计)人: | 陈瑞义;江烨;钱鹏程 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/00 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 王素琴 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 指数模型 评论文本 用户商品 评论 预处理 数据预处理 动态监测 分布特征 干扰数据 计算数据 评论状态 倾向分析 输出结果 文本数据 消费群体 新闻媒介 行为类型 行为指数 整体发展 媒介 预测 | ||
本发明提供一种网购用户买假指数模型的生成方法及系统,分别生成买假评论指数、买假行为指数和买假舆情指数,其中生成买假评论指数,具体通过获取电商平台上的用户商品评论文本数据和公开新闻媒介数据;经数据的预处理,获得用户商品评论文本和公开媒介舆情文本数据后,进行数据预处理,识别并排除各类干扰数据之后,进行买假评论识别、买假行为类型判断与不同主体买假舆情态度倾向分析后得出网购用户买假评论指数;该方法所生成的网购用户买假指数模型的计算数据易获取,模型输出结果唯一、较为稳定,且可动态监测与预测某段时间内,特定商品、特定消费群体的买假评论状态、买假行为与买假舆情分布特征及整体发展状态。
技术领域
本发明涉及一种网购用户买假指数模型的生成方法及系统。
背景技术
据相关搜索与比对发现,现有的网购用户大指数设计与编制技术有:
2015年,阿里巴巴基于全年在线上风险控制中的主动发现拦截上架、消费者投诉中被核实的售假商品链接,以及背后被阿里处罚关闭的上百万涉嫌售假商品数据,所构建的中国的假货活跃指数地图。但是该假货活跃指数的数据主要是通过对发布商品的基本信息与消费者投诉得出的,对于发布商品的基本信息,包括文字信息与图片信息,不包含关键词的,且消费者未投诉的买假,也称为知假买假,或买假不知假等,不能进行监测。
上述问题是在网购用户买假指数模型的生成过程中应当予以考虑并解决的问题。
发明内容
本发明的目的是提供一种网购用户买假指数模型的生成方法及系统,能综合反映不同平台、不同地区、不同商品类目、不同人群的消费者买假行为与买假行为态度倾向时序指标模型,通过买假评论指数、买假行为指数以及买假舆情指数来综合监测与预测网购用户的买假行为及其态度的发展趋势,解决现有技术中存在的通过对发布商品的基本信息与消费者投诉得出的,对于发布商品的基本信息,包括文字信息与图片信息,不包含关键词的,且消费者未投诉的买假,不能进行监测的问题。
本发明的技术解决方案是:
一种网购用户买假指数模型的生成方法,分别生成买假评论指数、买假行为指数和买假舆情指数,包括以下步骤:
S1、生成买假评论指数,具体为:
S11、获取电商平台上的用户商品评论文本数据;
S12、数据的预处理,获得用户商品评论文本数据后,进行数据预处理,识别并排除店铺商家存在的违规违约的刷评论数据,以得到有效用户评论数据;
S13、买假评论文本的识别,获得有效用户评论数据之后,再根据用户评论语句的相似度算法来计算和识别这些用户商品评论数据的内容是否为买假评论,并计数买假评论数量;
S14、买假评论指数的生成;
S2、生成买假行为指数,具体为:
S21、投诉数据获取,包括获取电商平台的用户商品投诉数据与线下用户商品投诉数据;
S22、数据的预处理,获得步骤S21的投诉数据后,确定投诉数据中属于网购用户买假投诉用户,并备案相关基础信息(包括网购用户买假投诉用户姓名、性别、年龄、平台账户ID,商品名称、购物所在平台名称、购物所在商铺名称),然后通过网购用户买假投诉用户备案基础信息,追溯并识别出非欺诈性买假行为和欺诈性买假行为;
S23、生产网购用户买假行为指数,编制与计算网购用户欺诈性买假行为指数;
S3、生成买假舆情指数,具体为:
S31、进行买假舆情数据采集,并将采集到的网络舆情数据进行文本分析和主题分类;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810238533.1/2.html,转载请声明来源钻瓜专利网。