[发明专利]基于文本描述匹配的服装面料样品检索方法有效
申请号: | 201910484107.0 | 申请日: | 2019-06-05 |
公开(公告)号: | CN110472108B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 周俊妍;薛文良;刘蕴莹;丁亦;钱竞芳 | 申请(专利权)人: | 东华大学 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/906 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
地址: | 201600 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文本 描述 匹配 服装面料 样品 检索 方法 | ||
1.一种基于文本描述匹配的服装面料样品检索方法,其特征在于,包括以下步骤:
1)文本描述信息标准化处理,完成信息分类
对用户提供的需求描述文本信息进行标准化处理,将标准化字段分为两类:第一类是检索类字段,即用户直接给出的可以通过简单文本匹配的方式检索的需求信息;第二类是预测类字段,将其输入神经网络,从而预测面料结构参数;
2)以检索类字段为搜索对象,搜索面料数据库,抽取面料待选集合,其中,提取检索类字段与面料数据库相应字段,匹配面料样品,包括以下步骤:
检索类字段由字符串与数值格式混合组成,其中字符串形式的字段匹配方式包括计算字符串相似度,若相似度低于阈值,则计算语义相似度,若相似度高于阈值,则基于Hownet中文词知识树,调用相关API接口完成相似度匹配,其中,字符串相似度是通过计算字段间相同的汉字数目来表征两字段的相似度,从而实现快速匹配,字段fi与字段fj的相似度表示为Sim(fi,fj),则有:
式中,Numsame指段fi与字段fj相同字符串的个数,Numi指字段fi的字符串长度,Numj指字段fj的字符串长度
3)将预测类字段输入神经网络预测模型,输出对应的面料结构参数,包括以下步骤:
步骤1、定义神经网络预测模型的输入数据X及输出数据Y,其中:
输入数据X是用户描述中的预测类字段,预测类字段以织物的内在风格描述为主,包括光滑度、悬垂度、柔软度以及光泽度四个指标,输入数据X以矩阵的形式输入;
输出数据Y有两类,第一类是离散类数据,包括面料成分、织造方式与织造工艺;第二类是连续类数据,包括织物密度、织物克重、纱支;对离散类数据而言,通过标签的形式自动标注,采用独热编码的方式进行量化;
步骤2、构建神经网络预测模型后,利用样本对神经网络预测模型进行训练,训练时每个样本重复进行步骤201至步骤203,经过多次迭代后,直到代价函数J(W,b)的值下降到阈值之下,停止训练,保存神经网络预测模型
步骤201、向前传播,向前传播的过程中利用sigmoid激活函数;
步骤202、利用交叉熵函数计算网络的代价函数J(W,b)的值;
步骤203、向后传播,向后传播的目的是为了计算梯度,更新权重,从而降低代价函数J(W,b)的值;
步骤3、输入预测类字段,输出面料结构参数预测结果
将预测类字段按照输入数据说明整理,以矩阵形式输入神经网络预测模型,保存实际面料结构参数预测结果;
4)以面料结构参数预测结果为搜索对象,搜索面料待选集合,返回面料推荐结果,其中,搜索方式针对不同格式的结构参数有所不同:
针对连续类结构参数:
提取预测得到的面料连续类结构参数,设定浮动阈值范围,遍历面料待选集合,搜索结构参数在范围内的面料样本,输出面料推荐集合R1;
针对离散类结构参数:
将独热编码形式的离散类结构参数转换为标签形式,继而转换为文本形式,按照检索类字段的检索方式遍历面料待选集合,输出面料推荐集合R2;
选择R1与R2的并集作为最后结果输出。
2.根据权利要求1所述的一种基于文本描述匹配的服装面料样品检索方法,其特征在于,步骤2中,所述神经网络预测模型采用三层神经网络架构,权重初始化采用随机初始化的方式,第一层是输入层,设置4个神经元,包含光滑度、悬垂度、柔软度以及光泽度这四个特征;第二层是隐含层,根据网络模型训练结果调整神经元个数n;第三层是输出层,神经元个数与输出数据类型有关,若输出数据为连续类数据,则输出层设置3个神经元,包括织物密度、织物克重、纱支;若输出数据为离散类数据,则输出层神经元个数设置与该离散类字段的详细内容的个数相同。
3.根据权利要求1所述的一种基于文本描述匹配的服装面料样品检索方法,其特征在于,步骤201中,sigmoid激活函数g(x)的公式如下:
式中,x表示输入数据;
第l层的线性计算值Z[]与激活值A[l]计算公式如下:
Z[l]=W[l]A[l-1]+b[l]
A[l]=g(Z[l])
式中,W[l]、b[l]指第l层的权重,g(Z[l])指第l层的激活值,第l-1层的激活值是第l层的输入值,除了当l=1时,A[0]即原始输入X,由此计算所述神经网络预测模型的实际输出值即输出层的激活值,记为
步骤202中,所述代价函数J(W,b)为:
式中,m指样本数,y(i)指第i个样本的理论输出值,指第i个样本的实际输出值;
步骤203中,梯度的计算公式如下:
dZ[l]=dA[l]*g′(Z[l])
dA[l-1]=W[l]TdZ[l]
式中,dZ[l]、dW[l]、db[l]、dA[l-1]分别指代价函数J(W,b)对第l层线性计算值Z[l]求导;代价函数J(W,b)对第l层权重W[l]求导;代价函数J(W,b)对第l层权重b[l]求导;代价函数J(W,b)对第l-1层激活值A[l-1]求导;A[l-1]T指第l-1层激活值矩阵的转置,Z[l](i)指第l层中第i个样本的线性计算值,W[l]T指第l层W权重矩阵的转置,通过计算每一层的dW[l]与db[l],更新每一层权重矩阵W[l]、b[l],公式如下:
W[l]=W[l]-αdW[l]
b[l]=b[l]-αdb[l]
式中,α指学习率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910484107.0/1.html,转载请声明来源钻瓜专利网。