[发明专利]一种基于网络评论文本与图片的电商服装缺陷评估方法在审
申请号: | 202010916327.9 | 申请日: | 2020-09-03 |
公开(公告)号: | CN112016324A | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 徐新胜;李晗 | 申请(专利权)人: | 中国计量大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/242;G06K9/62;G06T7/00;G06N3/04;G06Q30/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310018 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 评论 文本 图片 服装 缺陷 评估 方法 | ||
电商缺陷检测及评估多针对于文本进行建模分析。本发明公开了一种新的一种基于网络评论文本与图片的电商服装缺陷评估方法。该方法爬取客户反馈数据建立基于图片以及对应于图片的文本数据集。使用Faster R‑CNN网络进行图片缺陷检测,基于情感词典提取评论文本中缺陷及严重度,通过结合文本与图片的严重性评估计算模型计算该类服装缺陷严重性。该方法更充分利用客户反馈数据,结果可信度、精准度更高。
技术领域:
本申请涉及自然语言处理、图像检测领域,特别涉及服装缺陷检测以及情感方面提取方法。
背景技术:
随着互联网产业的迅猛发展,计算机相关技术的跳跃式演变以及行业规模的不断扩大创新,电子商务从最初的不被信任到现在动动手指就可以购物,电商平台对老百姓生活产生的影响不言而喻。根据第42次《中国互联网发展状况统计报告》显示,2018年上半年,全国网上零售额达到4.08万亿元,同比增长30.1%,其中实物商品网上零售额为3.13万亿元。2018年“双十一”狂欢节交易规模突破2000亿元。可以看出,网络购物这种新零售方式越来越普及,网购逐渐成为消费者购物的一个重要途径。
电子商务突飞猛进的发展产生了大量的在线评论数据,客户可以网络平台上谈论产品的所有特性。在以往的电商数据挖掘技术中,只是通过客户评论的文本进行产品数据挖掘。随着计算机技术和计算机网络技术的发展,用户的评论方式呈现多样性,用户在反馈产品信息时往往会附上图片,有的是用户的买家秀,也有的是产品所呈现的问题,用户无法对产品问题进行详细描述时,图片往往是最好的反馈手段。随着深度学习技术的发展,带动了自然语言处理技术与图像处理技术的发展。基于深度学习的图片检测以及情感分析模型被提出来,在以往使用文本对商品进行信息挖掘的基础上使用图像检测模型可以对用户评论中的图片进行分析挖掘,增加信息维度。
发明内容:
本发明的目的在于基于现有仅针对商品评论文本缺陷挖掘的模型,提出一种融合图像检测、情感方面提取的缺陷识别方法。更加充分利用商品反馈信息,获取商品所存在的缺陷种类以及严重程度。
本发明是通过以下技术方案来实现的:一种基于深度学习的电商服装图片缺陷识别方法以及基于情感词典的产品缺陷情感分析方法。
具体包括的步骤:
1、一种基于网络评论文本与图片的电商服装缺陷评估方法,具体步骤如下:
(1)采集电商客户反馈数据,建立缺陷数据集。网络爬取电商平台中服装评论文本以及对应的评论图片,建立服装缺陷图像数据集和对应的文本数据集。
a.服装缺陷图片数据集,作为负类型样本包括:起球、破洞、脱色、开线、脱线、褶皱、脏污。负样本数据与正常样本数据1:1构成图片样本数据集。通过图像裁剪、翻转、增加噪声等数据增强操作扩充数据量。
b.评论文本数据集,对特殊字符以及无意义文本清洗,通过上述缺陷标注构建缺陷词库。
(2)使用训练好的VGG-16卷积神经网络作为特征提取网络。经过不同层卷积计算提取原始图像中包含高层次特征与低层次特征生成的两种特征图,特征图分为两路,被后续RPN层和RoI Polling层所共享。
(3)训练RPN网络获取候选框位置,针对候选框筛选候选区域,并生成固定尺寸的特征图。判别候选区域所属物体类别,最终回归物体的精确位置。
(4)利用训练好的Faster R-CNN模型检测输入图像是否是服装缺陷。
(5)对文本评论进行分词,构造重复串,对分词结果进行频率过滤、内聚性过滤、左右熵过滤,添加新词到停词表中。基于多个公开词典构建情感词典。
(6)对评论文本进行切割,输入短文本以及图片检测缺陷,通过缺陷词库以及情感词典输出此类标记,通过融合图片及文本信息的情感计算公式获取缺陷严重程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010916327.9/2.html,转载请声明来源钻瓜专利网。