[发明专利]基于多层注意力机制并融合图谱的水利门户信息推荐方法有效
申请号: | 202010601160.7 | 申请日: | 2020-06-29 |
公开(公告)号: | CN111914895B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 张鹏程;高橙 | 申请(专利权)人: | 河海大学 |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06Q50/06 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 孟红梅 |
地址: | 210024 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多层 注意力 机制 融合 图谱 水利 门户 信息 推荐 方法 | ||
1.一种基于多层注意力机制并融合图谱的水利门户信息推荐方法,其特征在于,包括如下步骤:
(1)收集各大水利门户网站中的水利信息数据并进行预处理操作增加区域特征;
(2)使用Doc2Vec模型获得水利信息标题以及水利信息正文的文本表示向量,为特征集增加标题特征和正文特征向量;
(3)对标题和正文的文本表示向量进行聚类,并用手肘法确定出最终的文本主题类别个数,增加主题特征;
(4)将区域特征、主题特征、发布时间特征通过嵌入操作转换为与标题和正文特征相同维度的向量,形成最终的特征集;
(5)将特征集输入到特征级注意力机制中,对各个特征进行融合后,得到用户浏览过的每条水利信息的初步表示向量;
(6)收集每条水利信息的地区、时间和主题,构建水利信息图谱,并训练出图谱中每个实体的向量,将每条水利信息中的实体及融合图谱扩展后的实体的向量求平均,并与步骤(5)得到的初步表示向量相加得到水利信息的最终表示向量;
(7)将水利信息的最终表示向量输入到具有位置编码的自注意力机制,学习出用户每一个行为的表示向量;
(8)以待推荐水利信息为查询项,用户行为的表示向量为键项,利用注意力机制进行对键项加权求和得到用户的兴趣表示向量;
(9)计算用户的兴趣表示向量与待推荐水利信息的相关性,得到最终给用户进行推荐的列表。
2.根据权利要求1所述的一种基于多层注意力机制并融合图谱的水利门户信息推荐方法,其特征在于,所述步骤(1)包括:
(11)使用爬虫收集各大水利门户网站的水利信息数据,包括发布时间、水利信息标题、水利信息正文字段;
(12)初步处理数据,将数据中存在缺失的,含有异常值的相关数据删除;
(13)根据用户的历史点击水利信息行为序列,选取一个时间点对行为序列进行分割,形成训练集和测试集,时间点之前的行为序列为训练集,之后的为测试集;
(14)基于信息来源或内容为每条水利信息添加区域字段,为特征集增加区域特征。
3.根据权利要求1所述的一种基于多层注意力机制并融合图谱的水利门户信息推荐方法,其特征在于,所述步骤(2)包括:
(21)对收集到的水利信息数据中的水利信息标题以及正文进行去除停用词和分词操作;
(22)利用Doc2Vec模型中的PV-DM模型将标题和正文分别表示成向量的形式,作为标题特征和正文特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010601160.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:死时间校正方法、装置、计算机设备和存储介质
- 下一篇:一种多合缸空气透平机组