[发明专利]一种实时自动生成商品描述文本的方法在审
申请号: | 201910143793.5 | 申请日: | 2019-02-27 |
公开(公告)号: | CN109919721A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 吴磊彬;黄佳威;郑翔;吴君;徐雯斐 | 申请(专利权)人: | 上海宝尊电子商务有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/953;G06F16/955;G06N3/08 |
代理公司: | 上海卓阳知识产权代理事务所(普通合伙) 31262 | 代理人: | 周春洪 |
地址: | 200436 上海市静安*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品描述 自动生成 文本 商品信息 预处理 电子商务 商品特征 特征数据 网络爬虫 写作 学习 | ||
本发明涉及一种实时自动生成商品描述文本的方法,包括以下步骤:步骤s1:爬取商品特征数据的步骤;步骤s2:对爬取到的特征数据进行预处理提取有效商品信息的步骤;步骤s3:根据提取到的商品信息自动生成商品描述文本的步骤。本发明利用网络爬虫以及深度学习技术,解决现阶段电子商务中商品描述文本人工原创写作效率低、成本高、难以批量生成的不足。
【技术领域】
本发明涉及电子商务技术领域,具体涉及一种实时自动生成商品描述文本的方法。
【背景技术】
随着互联网技术的飞速发展,网上购物变得越来越普遍已经成为大众的一种日常行为习惯。现有的自然语言处理技术还没有应用到时尚领域,对商品的相关描述大多都是人工原创写作,靠人力创作不仅效率低下而且成本极高很难满足批量生成的需求。迫切需要自动生成商品描述文本以便让消费者更快地对商品有所了解、更好地服务于消费者。
网络爬虫(Web crawler),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,它们被广泛用于互联网搜索引擎或其他类似网站,可以自动采集所有其能够访问到的页面内容,以获取或更新这些网站的内容和检索方式。深度学习(Deep Learning)是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。专利权人阿里巴巴集团控股有限公司,申请号201210279081.4,发明名称《在商品图片中提取商品主体的方法和装置》,公开了能够更准确获取图片中商品主体位置的方法和装置;专利权人阿里巴巴集团控股有限公司,申请号201410597626.5,发明名称《商品图片的分割方法及其装置》,公开了商品图片的分割方法及其装置,图片分类之后优化了分割结果;申请人广州悦鸿方生物科技有限公司,申请号201710806047.0,发明名称《基于售卖设备用户信息进行信息采集和/或推送的系统》,公开了能够实现通过自动售卖设备的信息收集并进行推送,使得推送应用更为广泛;申请人武汉大学,申请号201710572175.3,发明名称《一种基于卷积神经网络的商品评论数据情感分类方法》,公开了具有简单、快速的特点,能够较好地提高评论数据情感分类的分类性能的分类方法;
申请人广州华企联信息科技有限公司,申请号201710271969.6,发明名称《一种基于深度学习的商品推荐方法及系统》,公开了一种基于深度学习的商品推荐方法,包括以下步骤:S1:通过爬虫抓取商品的评论数据;S2:对评论数据进行数据预处理;S3:对数据进行特征提取;S4:对商品评论进行细粒度分析;S5:对商品评论进行量化打分;S6:结合协同过滤进行商品推荐;相比于现有技术。该发明结合深度学习的方法对文本进行细化处理,并将其通过模糊隶属函数进行量化,可将用户的评论转化为对商品各项属性的打分情况,再结合协同过滤方法进行推荐,可达到较好的推荐效果。
本发明利用将网络爬虫以及深度学习技术应用到电子商务,对商品描述文本的生成进行了设计改进。
【发明内容】
本发明的目的是,利用网络爬虫以及深度学习技术,解决现阶段电子商务中商品描述文本人工原创写作效率低、成本高、难以批量生成的不足,提供一种实时自动生成商品描述文本的方法。
为实现上述目的,本发明采取的技术方案是一种实时自动生成商品描述文本的方法,包括以下步骤:
步骤s1:爬取商品特征数据的步骤;
步骤s2:对爬取到的特征数据进行预处理提取有效商品信息的步骤;
步骤s3:根据提取到的商品信息自动生成商品描述文本的步骤。
进一步的优选技术方案上述步骤s1:上述的爬取商品特征数据使用的网络爬虫技术是分布式爬虫、JAVA爬虫、非JAVA爬虫的任意一种。
进一步的优选技术方案上述步骤s2:上述的对爬取到的特征数据进行预处理包括通过文本分析的方法提取商品详情数据,和/或通过图像识别的方法提取商品图片中包含的商品信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海宝尊电子商务有限公司,未经上海宝尊电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910143793.5/2.html,转载请声明来源钻瓜专利网。