[发明专利]一种基于双向长短期记忆网络显式信息耦合分析的推荐方法在审
申请号: | 202011147322.0 | 申请日: | 2020-10-23 |
公开(公告)号: | CN112256859A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 张全贵;王天昊;李鑫 | 申请(专利权)人: | 辽宁工程技术大学 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/9535;G06F16/9536;G06N3/04 |
代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 韩登营 |
地址: | 123000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双向 短期 记忆 网络 信息 耦合 分析 推荐 方法 | ||
本发明公开了一种基于双向长短期记忆网络显式信息耦合分析的推荐方法,包括数据采集和处理、划分数据集、构建耦合模型、训练模型和项目推荐。本发明通过分析用户及项目相关的显式短文本信息之间微观的耦合关系,将BiLSTM双向长短期记忆网络和Attention注意力机制结合,得到融合了重要上下文信息的显式文本特征表示,结合隐式特征,从中分析出评论文本信息与用户主观情感之间的耦合关系,更好地表达用户的主观偏好,并融合用户/项目特征的显‑隐式耦合关系,为用户提供更准确的个性化推荐。同时,本发明采用卷积神经网络有助于更深层次的学习特征间的交互。
技术领域
本发明属于自然语言处理及计算机人工智能的技术领域,尤其涉及一种基于双向长短期记忆网络显式信息耦合分析的推荐方法。
背景技术
自然语言处理通常使用预训练的词向量来完成后续的任务,最初的词向量是通过浅层网络进行无监督训练得到的,虽然在词级上表现出不错的特性,但缺少对连续文本的内在联系和语言特征的表达能力。现如今,评论文本信息逐渐成为推荐系统的重要研究研究依据,而现存的很多推荐系统可解释性差,并认为用户和项目是独立同分布的而忽略了用户和项目之间的耦合性,同时没有达到对评论文本的情感分析与非独立同分布的推荐方法结合。
发明内容
基于以上现有技术的不足,本发明所解决的技术问题在于提供一种基于双向长短期记忆网络显式信息耦合分析的推荐方法,具有良好的推荐准确度和可解释性。
为了解决上述技术问题,本发明通过以下技术方案来实现:本发明提供一种基于双向长短期记忆网络显式信息耦合分析的推荐方法,包括以下步骤:
S1、数据采集和处理:从亚马逊下载评论数据集后清理脏数据,合并每个用户对应的所有项目的评论作为用户评论文本以及合并所有用户对项目的评论文本作为项目评论文本;
S2、划分数据集:将处理好的数据集按8:1:1的比例划分为训练集、测试集和验证集;
S3、构建耦合模型:卷积神经网络学习用户/项目显式-隐式耦合;多层感知器学习用户特征与项目特征之间的耦合;
S4、训练模型和项目推荐:步骤S2中所得到的训练数据集和测试数据集分别用于训练和评估步骤S3构建的耦合模型,根据用户对项目的预测评分判断是否将项目推荐给用户。
进一步的,所述步骤S1的数据采集和处理的具体步骤如下:
S101、将下载的Json格式的亚马逊产品评论数据集转化为Csv格式存储;
S102、将每个用户对应的所有项目的评论文本合并作为用户评论文本,将所有用户对项目的评论文本合并作为项目评论文本;
S103、删除每个用户评论文本低于50个单词的记录,清理用户评论文本中的停止词,标点符号,数字,频度小于10的词。
进一步的,所述步骤S3中构建耦合模型的具体步骤如下:
S301、构建输入层:输入层包括四个输入内容,用户项目ID和对应的用户项目评论文本;
S302、构建基于双向长短期记忆网络的用户及项目文本分析学习框架;
S303、构建输出层:预测用户对项目的评分。
进一步的,所述步骤S302中构建基于双向长短期记忆网络的用户及项目文本分析学习框架的具体步骤如下:
S302-1、构建向量映射层:将用户和项目ID通过全连接层转化为指定维度Embedding的向量,代表用户/项目的隐式特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工程技术大学,未经辽宁工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011147322.0/2.html,转载请声明来源钻瓜专利网。