[发明专利]基于多层注意力机制并融合图谱的水利门户信息推荐方法有效
申请号: | 202010601160.7 | 申请日: | 2020-06-29 |
公开(公告)号: | CN111914895B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 张鹏程;高橙 | 申请(专利权)人: | 河海大学 |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06Q50/06 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 孟红梅 |
地址: | 210024 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多层 注意力 机制 融合 图谱 水利 门户 信息 推荐 方法 | ||
本发明提出了一种基于多层注意力机制并融合图谱的水利门户信息推荐方法。针对收集的水利信息数据的特点,利用Doc2vec和聚类丰富特征集;在构建推荐模型时,首先借助soft‑attention形成特征级注意力机制对各特征进行融合,同时构建水利信息图谱,挖掘用户的潜在兴趣后形成每条水利信息的最终表示向量;然后用具有位置编码的self‑attention形成行为级注意力机制产生用户行为的表示向量;再次借助soft‑attention生成用户兴趣的表示向量;最后使用多层感知机计算用户点击水利信息的概率以生成最终的TOP‑N推荐列表。本发明方法能解决从事水利行业的人员无法一站式阅读感兴趣的水利信息的问题,且利用多层注意力机制及图谱能使推荐更加精确,可解释性更强。
技术领域
本发明涉及水利门户信息推荐方法,尤其是一种基于多层注意力机制并融合图谱的水利门户信息推荐方法。
背景技术
水利门户网站是水利部门进行水利信息整合、发布、为公众提供信息和服务的平台。它面向水利行业和社会,用来报道各种水事动态,传达和贯彻水利部有关文件和重大会议精神。经过水利信息化的不断发展,现如今水利网站繁多,每个流域以及省份乃至区县级别的地区都有其相应的水利网站。但是这些系统之间往往是相互独立的,数据难以整合和共享,严重了干扰水利行业从业人员关注自己感兴趣的水利信息的效率。经调研,如今水利门户网站的发展趋势是能够成为水利信息资源整合、共享的重要组成部分,因此搭建一个可以解决信息化进程中所面临的的各类水利信息孤立问题的平台已是一项迫切的需求。我们旨在建立一种水利信息推荐方法,以便给水利行业从业人员提供一个“一站式”的综合网站。这样,水利行业从业人员无须了解及访问过多地方门户网站就可以获取到感兴趣的水利信息内容推送。
现有的个性化推荐方法多种多样,但还没有应用到水利信息上。就其他领域的个性化推荐而言,传统的推荐方法常使用协同过滤、逻辑回归、因子分解、组合模型等。但相比于深度学习模型,这些传统方法在挖掘数据中隐藏的信息方面稍显逊色,而深度学习构建的模型十分灵活,可以同时融合图像、自然语言处理等领域的成果并迅速演化,现如今主流的推荐系统都已进入深度学习阶段。Wang等人使用知识图谱来丰富新闻实体中的信息同时加强了各个实体之间的联系,然而使用的特征过于单一,这会造成信息损失甚至产生“辛普森悖论”损害推荐系统的性能;Zhou等人提出了深度兴趣模型来预测商品点击率,他们利用注意力机制给各个点击的商品进行加权聚合以区分重要性,然而点击序列通常是时间相关的,模型并没有考虑进各个点击行为之间的依赖性;Wu等人提出一种具有注意力多视角学习的推荐方法,采用三层注意力机制分别对文本、新闻以及用户进行编码,但是对于用户而言,针对已经点击过的新闻是否可以对当前待推荐新闻具备一定的影响力,在这方面存在考虑不足的问题。
发明内容
发明目的:针对现有技术中存在的问题与不足,本发明目的在于提供一种基于多层注意力机制并融合图谱的水利门户信息推荐方法,以准确有效地进行水利信息的个性化推荐,方便用户使用,拓宽用户的阅读面。
技术方案:为实现上述发明目的,本发明所述的一种基于多层注意力机制并融合图谱的水利门户信息推荐方法,包括如下步骤:
(1)收集各大水利门户网站中的水利信息数据并进行预处理操作增加区域特征;
(2)使用Doc2Vec模型获得水利信息标题以及水利信息正文的文本表示向量,为特征集增加标题特征和正文特征向量;
(3)对标题和正文的文本表示向量进行聚类,并用手肘法确定出最终的文本主题类别个数,增加主题特征;
(4)将区域特征、主题特征、发布时间特征通过嵌入操作转换为与标题和正文特征相同维度的向量,形成最终的特征集;
(5)将特征集输入到特征级注意力机制中,对各个特征进行融合后,得到用户浏览过的每条水利信息的初步表示向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010601160.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:死时间校正方法、装置、计算机设备和存储介质
- 下一篇:一种多合缸空气透平机组