[发明专利]一种基于深度学习的商业推广信息精准推荐方法及系统有效

专利信息
申请号: 201910461767.7 申请日: 2019-05-30
公开(公告)号: CN110264311B 公开(公告)日: 2023-04-18
发明(设计)人: 苏俊健;王东;麦志领;何佳奋;纪淇纯;叶新华 申请(专利权)人: 佛山科学技术学院
主分类号: G06Q30/0601 分类号: G06Q30/0601;G06F16/35;G06F16/9536;G06F40/284
代理公司: 广州嘉权专利商标事务所有限公司 44205 代理人: 谢泳祥
地址: 528000 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 商业 推广 信息 精准 推荐 方法 系统
【权利要求书】:

1.一种基于深度学习的商业推广信息精准推荐方法,其特征在于,所述方法包括以下步骤:

步骤1,采集商业推广信息数据;

步骤2,对所采集到的商业推广信息数据进行预处理和清洗得到商业推广信息数据集;

步骤3,对商业推广信息数据集进行降维和特征选择;

步骤4,将特征选择得到的商业推广信息数据集划分为训练样本数据集和测试样本数据集;

步骤5,训练样本数据集和测试样本数据集通过word2vec模型得到用于训练的词向量;

在步骤5中,训练样本数据集和测试样本数据集通过word2vec模型得到用于训练的词向量的方法包括以下步骤:

步骤5.1,分词:由于中文特殊性,通过分词库对商业推广信息中语句进行分词得到词库,分词库包括Jieba词库、IK词库、mmseg词库、word词库;

步骤5.2,统计词频:遍历步骤5.1中分词后形成的词库,统计出现过的词语的频率并且对其进行编号;

步骤5.3,构造树形结果:依据出现步骤5.2中各个词的出现概率,构造Huffman树;

步骤5.4,生成节点所在的二进制码:将各个词的出现概率转换为二进制编码来表示步骤5.3中Huffman树中的各个节点;

步骤5.5,初始化各非叶子节点的中间向量和叶子节点中的词向量:所述Huffman树中的各个节点,都存储有一个长为m的向量,但叶子节点和非叶结点中的向量的含义不同,叶子节点中存储的是各词的词向量,是作为神经网络的输入的;而非叶结点中存储的是中间向量,对应于神经网络中隐含层的参数,与输入一起决定分类结果;

步骤5.6,训练中间向量和词向量:使用CBOW模型或Skip-Gram模型训练中间向量和词向量,最后得到商业推广信息的对应词向量;

步骤6,通过训练样本数据集训练LSTM神经网络和通过测试样本数据集测试LSTM神经网络准确度得到训练好的LSTM神经网络作为推荐系统;

在步骤3中,对商业推广信息数据集进行降维和特征选择的方法包括主成分分析方法、独立成分分析、线性判别分析、局部线性嵌入、拉普拉斯特征映射、多维缩放、等度量映射中任意一种降维方法;而特征选择使用基于单独最优的特征选择法的改良算法,所述特征为商业推广信息数据集中的公司的所在地、经营范围、注册信息经过文本向量化后的向量;单独最优的特征选择算法计算出每个特征单独使用时的可分性判据值,然后根据可分性判据值从大到小进行排序,取前30个可分性判据值较大的特征作为特征组合;所述基于单独最优的特征选择法的改良算法为以下公式:其中,x(i)=(x(1),x(2),x(3),…,x(n)),x(i)代表第i个特征,n为特征个数,J(X)表示该特征集合的可分性判据,N(x(i))表示第i个特征的不是缺失的数据量个数,M表示数据量的总量,N(x(i))/M表示了第i个特征在数据中的缺失程度;

在步骤4中,将特征选择得到的商业推广信息数据集划分为训练样本数据集和测试样本数据集的方法包括:留出法、交叉验证法、自助法任意一种方法;

在步骤6中,通过训练样本数据集训练LSTM神经网络和通过测试样本数据集测试LSTM神经网络准确度得到训练好的LSTM神经网络作为推荐系统的方法包括以下步骤:

步骤6.1,使用词向量训练LSTM神经网络:将训练样本数据集通过LSTM神经网络的遗忘门,开始LSTM神经网络的信息丢弃动作,信息丢弃动作由遗忘门中的sigmoid层实现,将查看sigmoid层前一个输出和当前词向量的输入,决定上一个状态学习的信息是否保留,所述LSTM神经网络包括输入门、遗忘门和输出门;

步骤6.2,将信息丢弃后的训练样本数据集通过LSTM神经网络的输入门,开始LSTM神经网络的信息更新动作,信息更新动作由输入门中的sigmoid层实现,然后tanh层将会改变LSTM神经网络的各个细胞状态,学习出新的知识;

步骤6.3,将信息更新后的训练样本数据集通过LSTM神经网络的输出门,输出一个向量,这个向量取决于步骤6.2中的细胞状态;首先,运行sigmoid层得到向量确定细胞状态的输出部分,把细胞状态通过tanh层进行处理,并将它和sigmoid门的输出相乘,得到LSTM网络的输出信息;

步骤6.4,使用测试数据输入步骤6.3中得到的LSTM网络,得到输出结果,与测试数据中的标签比对,验证网络的准确性,若准确度达到要求,则完成训练得到训练好的LSTM神经网络,将训练好的LSTM神经网络作为推荐系统。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910461767.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top