[发明专利]一种基于用户偏好异构性分析的推荐方法有效
申请号: | 201910399992.2 | 申请日: | 2019-05-14 |
公开(公告)号: | CN110134868B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 张全贵;靳赫;李鑫 | 申请(专利权)人: | 辽宁工程技术大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/0442;G06N3/048;G06N3/08;G06F16/35;G06F40/289 |
代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 陈晓宁;张丽萍 |
地址: | 123000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 偏好 异构性 分析 推荐 方法 | ||
1.一种基于用户偏好异构性分析的推荐方法,其特征在于,包括以下步骤:
步骤1:对Amazon公开数据集进行数据筛选,得到符合要求的数据集;
步骤2:对处理好的文本数据进行分词分句并对文本数据进行词向量训练和名词性短语提取;
步骤3:使用深度学习框架构建推荐系统模型;
步骤4:把预先处理好的文本数据分成训练集和测试集,使用步骤3构建的模型对训练集进行训练,并对训练好的模型应用于测试集进行评价得到最优的推荐模型;
在步骤1中对数据筛选的步骤如下:
步骤1.1:利用Python读取原始json数据文件并转换成CSV文件;
步骤1.2:然后从中筛选用户评论总数大于10条的数据,同时去除文本数据过长的数据;
在步骤2中的词向量训练和名词性短语提取步骤如下:
步骤2.1:利用Gensim的Word2Vec方法来进行词向量的训练;
步骤2.2:使用Spacy库进行句子的名词性短语提取;
步骤3中的深度学习框架构建步骤如下:
步骤3.1:对步骤1和步骤2.2处理的词语,名词性短语,句子进行分通道,学习其中用户对于不同粒度的偏好特征,然后把不同粒度的文本通道连接起来学习用户对评论物品的个性化偏好特征;
步骤3.2:对步骤1.2处理之后的UserId和ItemId进行初步学习并使用深度学习协同过滤分析用户对所评论项目的偏好特征公式如下:
fu=WuU+bu
fi=WiI+bi
其中,U和I分别表示用户和项目的one-hot向量组成的矩阵,W表示模型训练UserId和ItemId所对应的权重,b对应相应的偏置项,然后进行整体特征的学习,然后把fu和fi的结果连接起来作为一个整体作为整体协同过滤子网络的输出,其中代表fu和fi的输出结果按照行连接在一起,最后模型左边的输出为:
步骤3.3:把步骤3.1和步骤3.2所生成的两部分神经网络综合在一起进行联合学习最终输出用户对项目的个性化偏好,预测公式如下:
其中predict是输出的用户的偏好结果,Sigmoid是用户情感二分类函数,Wp是联合学习的网络权重,fui是协同过滤的学习结果,ftext是文本特异性偏好,bp是预测偏置项;
步骤4中模型应用于测试集评价的步骤如下:
步骤4.1:在步骤4的测试集中,一个UserId选取一条标签正例的数据并依照数据的每一个属性给它增加99个负例样本产生一个新的测试集;
步骤4.2:在步骤3.3已经训练好的推荐模型中输入步骤4.1中新生成的测试集。
2.如权利要求1所述的基于用户偏好异构性分析的推荐方法,其特征在于,步骤3中深度学习框架构建还包括:
步骤5.1:使用Keras框架搭建神经网络构建输入层,输入层包括五个输入内容,分别是UserId和ItemId,以及三个粒度即词语,名词性短语,句子的文本特征;
步骤5.2:搭建文本特征处理子网络,使用步骤2.1训练好的词向量作为文本特征学习网络的嵌入层的初始化权重,并固定权重不做训练;
步骤5.3:搭建协同过滤子网络,使用嵌入层来让数字Userid和Itemid进行向量化操作;
步骤5.4:联合学习,把文本特征处理子网络和协同过滤子网络的输出通过Concatenate层连接起来送入全连接层进行学习然后使用Sigmoid作为激活函数输出user通过短文本评论对于物品item的偏好结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工程技术大学,未经辽宁工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910399992.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:企业信息查询方法及相关产品
- 下一篇:一种信息推送方法、装置、设备和存储介质