[发明专利]一种基于电商运营的自动类目识别的方法在审
申请号: | 202110690323.8 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113420114A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 陈立秀;姚民伟;谢传家 | 申请(专利权)人: | 浪潮卓数大数据产业发展有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/951;G06F40/289;G06K9/62;G06N3/04 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 郗艳荣 |
地址: | 214029 江苏省无锡市滨*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 运营 自动 类目 识别 方法 | ||
1.一种基于电商运营的自动类目识别的方法,其特征在于:包括以下步骤:
第一步,利用爬虫技术采集电商平台商品信息,爬取商品标题信息;
第二步,利用神经网络框架训练词向量模型,搭建用于文本分类的深度学习算法模型;
第三步,对深度学习算法模型进行训练,并根据训练结果对模型参数进行调整,从而提高深度学习算法模型的准确率;
第四步,将电商运营数据输入训练后的深度学习算法模型,即可自动识别商品类目,对商品进行分类。
2.根据权利要求1所述的基于电商运营的自动类目识别的方法,其特征在于:所述第一步中,对商品标题信息进行预处理,将商品标题信息分割成数个中文单词拼接的形式。
3.根据权利要求2所述的基于电商运营的自动类目识别的方法,其特征在于:所述预处理是指去除符号,并利用开源词向量工具pkuseg对商品标题句子进行分词,去停用词。
4.根据权利要求1所述的基于电商运营的自动类目识别的方法,其特征在于:所述第二步中,搭建python开发环境Anaconda,利用开源库的神经网络框架训练词向量模型,搭建用于文本分类的深度学习算法模型。
5.根据权利要求4所述的基于电商运营的自动类目识别的方法,其特征在于:所述神经网络框架采用TensorFlow或Keras。
6.根据权利要求1或5所述的基于电商运营的自动类目识别的方法,其特征在于:所述第二步中,词向量模型采用skip-gram算法,词向量维度为128。
7.根据权利要求6所述的基于电商运营的自动类目识别的方法,其特征在于:所述第二步中,深度学习算法模型采用TextCNN算法模型。
8.根据权利要求1所述的基于电商运营的自动类目识别的方法,其特征在于:所述第三步中,模型参数包括卷积核个数及dropout值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司,未经浪潮卓数大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110690323.8/1.html,转载请声明来源钻瓜专利网。