[发明专利]互联网电商商品信息四品一械识别分类方法在审

专利信息
申请号: 201910056584.7 申请日: 2019-01-22
公开(公告)号: CN109858027A 公开(公告)日: 2019-06-07
发明(设计)人: 林文东;王志永;郭建辉;叶炳坤 申请(专利权)人: 北京万诚信用评价有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06F16/35;G06N3/04;G06N3/08;G06Q30/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 100007 北京市东城区和*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分类识别 商品信息 分类 分词处理 目标函数 错误率 构建 语料 互联网电子商务 神经网络结构 测试数据 分类模型 分类统计 交易平台 纠错处理 模型分类 数据分布 数据分析 统计测试 系统构建 语料信息 数据处理 词向量 互联网 向量化 准确率 比对 词性 迭代 向量 测试 分析 网络
【权利要求书】:

1.一种互联网电商商品信息四品一械识别分类方法,其特征在于,所述方法包括:

A1、收集整理商品信息及其它文本信息作为语料进行分词处理;

A2、对分词处理后的语料进行词向量计算,并建立相应的词向量库和词性向量库;

A3、构建四品一械识别分类模型的深度学习网络;

A4、分类标注商品信息作为训练样本,及进行迭代训练网络直至完成识别分类模型训练;

A5、测试分析完成训练的分类模型识别率情况;

A6、统计模型分类错误的商品数据与分类模型目标函数值域范围的分布情况;

A7、构建纠错层对分类模型识别商品信息分布的目标函数值进行过滤预处理;

A8、分类处理后的输出层输出分类结果数据。

2.根据权利要求1所述的互联网电商商品信息四品一械识别分类方法,其特征在于:所述步骤A1中,收集正版发布过的文章、小说、新闻等,及采集反映大众熟悉网络商品交易平台中的商品信息描述,并将训练数据语料进行格式化预处理。

3.根据权利要求1所述的互联网电商商品信息四品一械识别分类方法,其特征在于:所述步骤A2中,对需要将原始的训练语料转化成一个语料句子的迭代器,每一次迭代返回的语料句子是一个格式化的词语列表,并通过自然语句处理库的模型计算构建词向量库模型对象。

4.根据权利要求1所述的互联网电商商品信息四品一械识别分类方法,其特征在于:所述步骤A2中,通过自然语言处理库的词向量计算模型处理,对商品信息文本语料进行词向量库和词性向量库的构建。

5.根据权利要求1所述的互联网电商商品信息四品一械识别分类方法,其特征在于:所述步骤A3中,采用多框架结合设计的深度学习网络技术,使网络能更多的结合深度学习框架的优点。

6.根据权利要求1所述的互联网电商商品信息四品一械识别分类方法,其特征在于:所述步骤A3中,设计的训练网络层次不会太深,无pooling层处理,设计的网络包含有6层,具体包括:

H1:第一层卷积神经网络(CNN);

H2:第二、三层双向长短时记忆循环神经网络(Bi-directional LSTM RNN);

H3:第四、五层全连接层神经网络(Fully Connected layer简称FC);

H4:最后由一个分类器作为输出层,输出分类结果目标函数值。

7.根据权利要求1所述的互联网电商商品信息四品一械识别分类方法,其特征在于:所述步骤A4中,不是固定分类样本比例值,而是通过收集分类标注商品信息,及测试分析分类训练样本数量的比例分布,确定最适合商品信息文本分类模型训练样本的比例值范围。

8.根据权利要求1所述的互联网电商商品信息四品一械识别分类方法,其特征在于:所述步骤A4中,四品一械分类模型的验证样本包含训练集样本和测试集样本两部分,确定模型训练完成的指标是通过模型的迭代训练以达到模型指标值的稳定,为模型训练完成的标准,其中指标值由训练集样本和测试集样本的识别准确率和损失函数值确定。

9.根据权利要求1所述的互联网电商商品信息四品一械识别分类方法,其特征在于:所述步骤A5中,构建一个展示分析商品信息错误分类分布情况的统计模型,进行统计分类模型识别处理后的错误分类商品信息的概率分布情况。

10.根据权利要求1所述的互联网电商商品信息四品一械识别分类方法,其特征在于:所述步骤A6中,不直接用分类模型对商品信息识别分类后的最大目标函数值为最终的分类结果,而是在分类模型识别处理后的错误分类商品信息的概率分布情况统计分析基础上,统计分析分类模型对商品信息错误分类识别后输出的所有目标函数值的分布关系,及根据商品信息错误分类的数据中“错误识别数1”和“错误识别数2”的测试样本目标函数值的分布统计情况,构建分类模型错误分类目标函数值与错误分类的关联关系。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京万诚信用评价有限公司,未经北京万诚信用评价有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910056584.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top