[发明专利]一种基于文本的消费意图分析方法有效
申请号: | 202110485144.0 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113095088B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 丁效;刘挺;秦兵;蔡碧波 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06N20/00 |
代理公司: | 哈尔滨华夏松花江知识产权代理有限公司 23213 | 代理人: | 岳昕 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 消费 意图 分析 方法 | ||
一种基于文本的消费意图分析方法,它属于消费意图分析技术领域。本发明解决了由于现有方法忽略了彼此相距较远的节点的结构相似性,导致对消费意图分析的准确度低的问题。本发明提出的技术将任务描述为一个异构图推理任务,以充分利用全局连接信息,使用节点聚合机制来捕获语义特征,使用元结构来显式地建模远距离节点之间的拓扑结构相似性,考虑了远距离节点之间的拓扑结构相似性后,可以大幅提高消费意图分析结果的准确度。本发明可以应用于消费意图分析。
技术领域
本发明属于消费意图分析技术领域,具体涉及一种基于文本的消费意图分析方法。
背景技术
许多人类的消费意图是由他将要做的事情所触发的。例如,如果一个人想“跑步”,他可能需要一双“跑鞋”。事实上,挖掘这样的事件与产品的关系对社交媒体平台和电子商务网站都可以起到作用,以帮助他们更好地了解客户,并修正他们对个体的广告策略。事件-产品对识别(EPI)任务旨在识别事件是否能触发一个人对产品的消费意图,是目前在社交媒体平台和电子商务网站等领域非常重要的商业需求,遂此任务的目标是帮助构建和完成大规模事件-产品知识库。例如,如图1和图2所示,给定事件-产品对(e1,p1),此任务的目标是确定想要“摆脱干燥皮肤”的人是否需要“面膜”。此任务具有挑战性的问题有待解决。即事件-产品对的上下文信息有限,无法捕捉事件和产品之间的复杂关系。
此前所在消费意图分析领域的方法,如文献(Xinyu Fu,Jiani Zhang,ZiqiaoMeng,and Irwin King.2020.MAGNN:Metapath Aggregated Graph Neural Network forHeterogeneous Graph Embedding.In WWW 2020:The Web Conference.2331–2341.)是将节点嵌入到保留网络语义和结构信息的稠密向量中。为了处理多种类型的节点和关系,元路径被广泛用于将原始异构网络转换为多个同构网络,进而进行特征聚合,即节点从每个同构网络的拓扑邻居中聚合特征信息。这样,特征信息在网络拓扑上传播以生成节点嵌入,从而有利于下游任务。然而,现有的异构图神经网络的工作大多集中在保持“接近”(proximity)的概念,而不是局部拓扑结构的概念。在这里,“接近”是一种节点级特征,这意味着两个节点在图中空间的距离较近。而局部拓扑结构是一种立足于全局图结构上的结构特征。
近几年来,大量此任务的工作集中在神经网络的图表,如文献(PetarGuillem Cucurull,Arantxa Casanova,Adriana Romero,Pietro Liò,and YoshuaBengio.2018.Graph Attention Networks.In ICLR 2018:Interna tional Conferenceon Learning Representations 2018.以及Tom Young,Devamanyu Hazarika,SoujanyaPoria,and Erik Cambria.2017.Recent Trends in Deep Learning Based NaturalLanguage Processing.arXiv preprint arXiv:1708.02709(2017).)。图神经网络(GNN)的目标是将图中的每个节点hv嵌入到一个低维向量空间中。通过学习得到的向量可以用于许多下游任务,例如节点分类、节点聚类和链接预测。应用于此任务的GNN可分为两类:基于频谱的GNN(spectral-based GNNs)和基于空间的GNN(spatial-based GNNs)。
其中较早期的工作集中于基于频谱的GNN,其利用图傅里叶变换(Graph FourierTransform)实现卷积。即利用图的拉普拉斯矩阵(Laplacian matrix)导出其频域上的拉普拉斯算子,再类比频域上的欧式空间中的卷积,导出图卷积的公式。基于频谱的GNN的主要缺点是只能执行直推学习(transductive learning),即为图中的每个节点训练唯一嵌入,使其无法自然地推广到看不见的节点,并且具有较差的可拓展性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110485144.0/2.html,转载请声明来源钻瓜专利网。