[发明专利]网购用户买假指数模型的生成方法及系统在审
申请号: | 201810238533.1 | 申请日: | 2018-03-21 |
公开(公告)号: | CN108428156A | 公开(公告)日: | 2018-08-21 |
发明(设计)人: | 陈瑞义;江烨;钱鹏程 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/00 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 王素琴 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 指数模型 评论文本 用户商品 评论 预处理 数据预处理 动态监测 分布特征 干扰数据 计算数据 评论状态 倾向分析 输出结果 文本数据 消费群体 新闻媒介 行为类型 行为指数 整体发展 媒介 预测 | ||
1.一种网购用户买假指数模型的生成方法,其特征在于:分别生成买假评论指数、买假行为指数和买假舆情指数,包括以下步骤:
S1、生成买假评论指数,具体为:
S11、获取电商平台上的用户商品评论文本数据;
S12、数据的预处理,获得用户商品评论文本数据后,进行数据预处理,识别并排除店铺商家存在的违规违约的刷评论数据,以得到有效用户评论数据;
S13、买假评论文本的识别,获得有效用户评论数据之后,再根据用户评论语句的相似度算法来计算和识别这些用户商品评论数据的内容是否为买假评论,并计数买假评论数量;
S14、买假评论指数的生成;
S2、生成买假行为指数,具体为:
S21、投诉数据获取,包括获取电商平台的用户商品投诉数据与线下用户商品投诉数据;
S22、数据的预处理,获得步骤S21的投诉数据后,确定投诉数据中属于网购用户买假投诉用户,并备案相关基础信息,然后通过网购用户买假投诉用户备案基础信息,追溯并识别出非欺诈性买假行为和欺诈性买假行为;
S23、生产网购用户买假行为指数,编制与计算网购用户欺诈性买假行为指数;
S3、生成买假舆情指数,具体为:
S31、进行买假舆情数据采集,并将采集到的网络舆情数据进行文本分析和主题分类;
S32、按照不同的主题分为欺诈性买假和非欺诈性买假这两大主题来统计三类主体包括主流新闻、企业人士和普通网这三大主体的买假舆情,并通过网络舆情模糊评估模型进行指标评判,计算出各指标的舆情指数;
S33、通过加权算法计算不同主题、不同主体的网络舆情综合指数。
2.如权利要求1所述的网购用户买假指数模型的生成方法,其特征在于:步骤S12中,数据预处理具体为:
S121、去除商家自评论数据;
S122、去除评论字数不规范的评论数据;
S123、去除评论文字雷同的评论数据;
S124、去除违规刷屏的评论数据。
3.如权利要求1所述的网购用户买假指数模型的生成方法,其特征在于:步骤S13中,相似度算法具体为,按假冒商品类型划分构建网购用户买假语料库,通过关键词匹配实现识别。
4.如权利要求3所述的网购用户买假指数模型的生成方法,其特征在于:步骤S13的相似度算法中,对于复杂文本,建立基于语料库的买假用户评论识别案例推理模型进行识别。
5.如权利要求1所述的网购用户买假指数模型的生成方法,其特征在于:步骤S14具体为,
S141、生成f类目i商品j店铺的网购用户买假评论指数:获得买假评论条目后,除以有效用户评论,即得出网购该商品的所有用户买假评论比例值,其等于其中,mBC为购买该商品的网购用户买假评论数量,m为购买该商品的网购用户有效评论数量;
S142、生成f类目i商品的网购用户买假评论指数:其等于f类目的i商品下的所有店铺的网购用户买假评论的比例值的累和平均值,计算公式为:
其中,n为f类目下i商品所有店铺数量;
S143、生成f类目商品的网购用户买假评论指数:其等于f类目下的所有商品的网购用户买假评论的比例值的累和平均值,计算公式为:
其中,n为f类目下i商品所有店铺数量,k为f类目下所有商品的数量;
S144、生成网购用户买假评论指数:其等于所有类目网购商品的网购用户买假评论的比例值的累和平均值,计算公式为:
其中,19为商品类目主体数量值,其中,n为f类目下i商品所有店铺数量,k为f类目下所有商品的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810238533.1/1.html,转载请声明来源钻瓜专利网。