[发明专利]基于层级多通道注意力的用户异常评论检测方法及系统有效

专利信息
申请号: 202010857424.5 申请日: 2020-08-24
公开(公告)号: CN112015862B 公开(公告)日: 2023-02-03
发明(设计)人: 范时平;杨松菱;桑春艳 申请(专利权)人: 重庆邮电大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F40/211;G06F40/289;G06F40/30;G06F18/241;G06F18/2415;G06N3/0464;G06N3/047;G06N3/048;G06N3/08
代理公司: 重庆辉腾律师事务所 50215 代理人: 王海军
地址: 400065 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 层级 通道 注意力 用户 异常 评论 检测 方法 系统
【说明书】:

发明涉及自然语言处理领域,具体涉及一种基于层级多通道注意力的用户异常评论检测方法,该方法包括:实时获取用户评论数据,将获取的用户评论数据输入到训练好的用户评论数据检测模型中,判断该评论是否异常;本发明避免了基于机器学习方法检测用户异常评论中繁琐的特征工程设计,并分析了用户评论文本的特点,克服了单一深度神经网络模型和单层注意力机制不能或不充分捕获全局语义的问题。

技术领域

本发明涉及自然语言处理领域,具体涉及一种基于层级多通道注意力的用户异常评论检测方法及系统。

背景技术

随着互联网的飞速发展,规模不断扩大,网络评论的数量和影响力也在不断增加,特别是近年来电子商务的快速发展,越来越多的用户开始参考之前用户的评论信息来做出购买决策。积极的用户评论可以促进商品店铺的影响力,增加销售,带来经济效益;相反,一些异常的用户评论会影响用户的网络购物体验,甚至不法分子通过雇佣水军来发布不实评论攻击竞争对手,带来恶性竞争。由于巨大利益的驱使,用户的异常评论能给电子商务产业造成巨大危害,并且还具有不断进化蔓延的趋势,使其受到国内外研究人员的广泛关注。因此检测分布在各电子商务平台的用户异常评论信息是一个十分紧迫而且重要的话题。

用户评论文本一般是短文本,具有数量大、噪声多、影响力大、隐蔽性强、识别难度高等特点,并且稀疏性比较强。早期对于用户异常评论的检测方法主要通过人工设计特征工程,提取语言和心理学相关特征、浅层语义特征、元数据特征等利用机器学习的方法获取浅层语义信息进行判定。但是,特征设计过程耗时且具有挑战性,不同数据集的数据稀疏程度、数据集的领域范围、语言的表述方式、评论者的关注方式各不相同,需要选取不同的特征进行实验,然而特征的设计依赖于专家的经验,特征选取的不同将会影响最终模型的分类效果。

随着深度学习技术的发展,深度神经网络模型开始应用于自然语言处理众多任务的语义表示,并取得优异的性能。深度神经网络模型由于使用隐藏层自动进行特征提取,避免了繁杂的人工构造特征工程,降低噪声,捕获复杂的语义信息,与此同时,神经网络模型通过词向量的方式一定程度上缓解了标记数据的稀疏性。但是,仅仅基于深度神经网络模型对用户评论进行检测,也存在一定的缺陷,比如,单一的神经网络模型都有各自的缺点,评论文本具有一定的层次性,不同的词语构成句子,不同的句子形成文档,对于不同的用户和不同的产品,评论文本中不同的词语和句子对于语义理解的贡献度不同,从而造成单一的注意力机制难以捕获全局语义信息。

发明内容

为解决以上现有技术的问题,本发明提出了一种基于层级多通道注意力的用户异常评论检测方法,该方法包括:实时获取用户评论数据,将获取的用户评论数据输入到训练好的用户评论数据检测模型中,判断该评论是否异常用户评论数据检测模型包括卷积神经网络模型和双向长短时记忆网络模型;

训练用户评论数据检测模型的过程包括:

S1:获取用户评论数据集,对用户评论数据集进行预处理,得到评论文本词向量矩阵;

S2:根据评论文本词向量矩阵求取评论文本词向量矩阵的情感向量、词性向量以及词语位置向量;

S3:根据论文本词向量矩阵、情感向量、词性向量以及词语位置向量求出情感词注意力通道的特征矩阵Ye、词性注意力通道的特征矩阵Yp以及词语位置注意力通道的特征矩阵Yl

S4:将Ye、Yp、Yl依次输入卷积神经网络模型中进行卷积计算,得到评论文本的局部特征ci

S5:对局部特征ci进行排列组合,得到新的特征C;

S6:将新的特征C输入到长短时记忆网络模型中提取上下文信息;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010857424.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top