[发明专利]一种基于网络评论文本与图片的电商服装缺陷评估方法在审
申请号: | 202010916327.9 | 申请日: | 2020-09-03 |
公开(公告)号: | CN112016324A | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 徐新胜;李晗 | 申请(专利权)人: | 中国计量大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/242;G06K9/62;G06T7/00;G06N3/04;G06Q30/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310018 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 评论 文本 图片 服装 缺陷 评估 方法 | ||
1.一种基于网络评论文本与图片的电商服装缺陷评估方法,具体步骤如下:
(1)采集电商客户反馈数据,建立缺陷数据集。网络爬取电商平台中服装评论文本以及对应的评论图片,建立服装缺陷图像数据集和对应的文本数据集。
a.服装缺陷图片数据集,作为负类型样本包括:起球、破洞、脱色、开线、脱线、脏污。负样本数据与正常样本数据1:1构成图片样本数据集。通过图像裁剪、翻转、增加噪声等数据增强操作扩充数据量。
b.评论文本数据集,对特殊字符以及无意义文本清洗,通过上述缺陷标注构建缺陷词库。
(2)使用训练好的VGG-16卷积神经网络作为特征提取网络。经过不同层卷积计算提取原始图像中包含高层次特征与低层次特征生成的两种特征图,特征图分为两路,被后续RPN层和RoI Polling层所共享。
(3)训练RPN网络获取候选框位置,针对候选框筛选候选区域,并生成固定尺寸的特征图。判别候选区域所属物体类别,最终回归物体的精确位置。
(4)利用训练好的Faster R-CNN模型对于输入图像是否是服装缺陷进行检测。
(5)对文本评论进行分词,构造重复串,对分词结果进行频率过滤、内聚性过滤、左右熵过滤,添加新词到停词表中。基于多个公开词典构建情感词典。
(6)对评论文本进行切割,输入短文本以及图片检测缺陷,通过缺陷词库以及情感词典输出此类标记,通过融合图片及文本信息的情感计算公式获取缺陷严重程度。
2.根据权利要求1所述一种基于网络评论文本与图片的电商服装缺陷评估方法,其特征在于,步骤(1)中,服装图片来源于淘宝、京东的服装商店评论区域。使用scrapy框架对两个电商网站进行爬取,获取不同种类的女装上衣评论。通过评论星级筛选存在缺陷的服装图片,以8:2的比例将缺陷服装图片划分为训练集和测试集,训练集用来训练缺陷检测模型,测试集用来验证训练模型的准确性。使用LabelImg对服装数据集进行缺陷标注,标注内容为缺陷名称和缺陷坐标bbox。将标注好的图片和对应生成的xml文件按照COCO数据集格式制作缺陷服装数据集。
3.根据权利要求1所述一种基于网络评论文本与图片的电商服装缺陷评估方法,其特征在于,步骤(2)中,使用经过多次卷积和少部分卷积的特征图输入RPN网络,保证提取深度特征的同时增加了检测细小缺陷的能力。
4.根据权利要求1所述一种基于网络评论文本与图片的电商服装缺陷评估方法,其特征在于步骤(1)到(4)中用电商服装训练数据集对Faster R-CNN网络进行训练,建立服装缺陷识别模型,利用训练好的模型检测输入的服装图片是否存在缺陷以及输出在图片中标定缺陷的位置。
5.根据权利要求1所述一种基于网络评论文本与图片的电商服装缺陷评估方法,其特征在于,步骤(6)中,通过层次分析划分获取不同缺陷本身存在的缺陷严重占比值,分别建立文本与图像评估缺陷严重性的得分模型,统一量纲得到基于文本与图像的服装缺陷严重性评估模型。模型如下:
其中Score(Fi)为模型最终得到的严重性得分,Score(Fi,p)为根据图片信息得到的服装缺陷严重性得分,Score(Fi,w)为根据文本信息得到的服装缺陷严重性得分,β为各因素对于信息感知性影响的占比,α为各因素统一量纲的比值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010916327.9/1.html,转载请声明来源钻瓜专利网。