[发明专利]一种基于图注意力神经网络的虚假影评检测方法在审
申请号: | 202310255641.0 | 申请日: | 2023-03-16 |
公开(公告)号: | CN116166806A | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 王海舟;杨菲;陈雅宁;金地;周罡;王文贤;陈兴蜀 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/126;G06F40/216;G06F16/951;G06F16/955;G06N3/04 |
代理公司: | 成都禾创知家知识产权代理有限公司 51284 | 代理人: | 刘凯 |
地址: | 610065 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 神经网络 虚假 影评 检测 方法 | ||
本发明公开了一种基于图注意力神经网络的虚假影评检测方法,首先构建网络爬虫采集电影平台的数据并对评论文本信息进行人工标注构建数据集;使用采集到的用户、电影和评论数据构建异构图,确认异构图中的结点并提取结点特征,使用TF‑IDF算法、归一化和ConSERT模型对结点的特征进行提取;构建基于异构图的图注意力网络,包括基于结点的注意力机制和基于元路径的注意力机制,得到包含语义信息的评论结点嵌入用于分类。本发明首次提出了使用异构图捕获结点上下文语义信息的方式对虚假影评进行检测,较传统基于文本的分类方式有着更好的效果,为将来的虚假影评检测提供了方法与思路。
技术领域
本发明涉及计算机科学与技术中的网络安全技术领域,具体为一种基于图注意力神经网络的虚假影评检测方法。
背景技术
随着经济的迅速发展,人民的生活水平得到了极大的提高,人们对生活品质的要求也越来越高。这对我国娱乐行业的发展起到了很大的推动作用。观赏电影是人们日常生活中常用的休闲方式之一,近年来随着网络购票与在线评论平台的发展,消费者可以更便捷的进行挑选电影、购票等操作。
但与此同时,在网络购票给人们带来方便的同时,也带来了不少的弊端。电影行业近年来的快速发展,在带来了巨大的经济利益的同时也使得电影市场的恶性竞争更加严重,电影制作厂商请人代发一些虚假影评、恶意影评的现象时有发生。长此以往,虚假影评的泛滥不仅会对平台的可信度造成影响,导致平台利益受损,也会对消费者的权益造成影响,更有甚者,虚假影评的肆无忌惮,极有可能造成电影产业中劣币驱逐良币的情况发生,对整个电影行业的发展造成冲击。
目前已经有很多虚假评论检测的相关工作,但基本聚焦于电商平台的虚假评论,由于电影评论与传统产品评论的特性存在一定的差异,经典的虚假评论检测方法在虚假影评中表现不佳。
发明内容
针对上述问题,本发明的目的在于提供一种基于图注意力神经网络的虚假影评检测方法,使用异构图捕获结点上下文语义信息的方式对虚假影评进行检测,具有更好的检测效果。技术方案如下:
一种基于图注意力神经网络的虚假影评检测方法,包括以下步骤:
步骤1:数据集构建
设计有针对性的爬虫,采集某电影平台一定时间段内各种题材的电影基本信息、相关的电影评论信息及发表评论用户的基本信息,并对评论文本数据进行标注,构建影评数据集;
步骤2:特征提取
根据电影的电影简介进行关键词提取后使用TF-IDF算法生成电影特征向量;对用户的等级、阅片数和过往评论的一系列数据进行归一化,得到用户特征向量;使用基于BERT模型的ConSERT框架对评论文本进行句向量的提取,得到评论特征向量;
步骤3:检测模型
构建基于图注意力神经网络的检测模型,将提取到的电影特征向量、用户特征向量和评论特征向量进行拼接作为模型的输入;使用一个结点级的注意力机制,以学习基于元路径的邻居的权重,并将其加权汇总以获得第一步结点嵌入;再使用基于元路径的注意力机制,分辨元路径的不同,学习不同元路径的权重,将第一步获得的结点嵌入进行加权组合得到最终的结点嵌入以进行分类任务,最终输出检测结果。
进一步的,所述步骤1具体包括:
步骤1.1:使用电影名构建一个URL,并使用Requests库构建一个Request对象,向服务器请求资源,返回电影相关信息后使用BeautifulSoup库对返回的网页进行解析,获取电影名所对应的电影ID;
步骤1.2:使用该电影平台的API接口,结合电影ID构建URL,使用Request请求资源,返回包含电影详细信息和电影评论信息的JSON文件;
步骤1.3:结合从电影评论信息中获取的用户ID信息,获取用户主页的JSON文件,得到用户信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310255641.0/2.html,转载请声明来源钻瓜专利网。