[发明专利]分类模型训练方法、异常评论检测方法、装置及设备有效
申请号: | 201910133882.1 | 申请日: | 2019-02-22 |
公开(公告)号: | CN110162621B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 温蕊 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 训练 方法 异常 评论 检测 装置 设备 | ||
本申请公开了一种分类模型训练方法,包括:获取语料集,根据语料集构建黑词库,获取目标评论系统中的评论数据集,根据评论数据集扩充所述黑词库,对评论数据集中各评论数据进行行为特征提取并根据黑词库进行内容特征提取,根据行为特征和内容特征生成携带有类型标签的训练特征向量;以评论数据集中各评论数据对应的训练特征向量作为训练样本,对分类模型进行多次迭代训练,通过当前迭代训练的分类模型对评论数据集中各评论数据进行预测,根据预测类型为异常的评论数据更新黑词库,基于更新后的黑词库更新所述训练样本,以进行下一次迭代训练直至所述分类模型和所述黑词库处于稳定态。本申请还公开了相应的异常评论检测方法、装置、设备及介质。
技术领域
本申请涉及计算机技术领域,尤其涉及分类模型训练方法、异常评论检测方法、装置、设备及存储介质。
背景技术
如今很多网络平台都给用户提供评论系统,以供用户在平台上发布评论,并且可以通过发布评论的方式与其他用户互动。然而由于评论系统具有开放性、交互性和廉价性,作弊者就会利用评论系统的这些属性,试图通过评论系统发布广告信息、从事非法活动,而作弊者在评论系统中发布的评论被称为异常评论,也被称为作弊评论。
因此,网络平台为了保证平台安全、健康发展,就需要进行反作弊操作,具体利用异常评论检测技术检测并过滤掉评论系统中出现的异常评论,从而净化平台环境。
然而,随着网络平台数据的爆发式增长和网络环境的日益复杂,异常评论逐渐呈现出对抗性;而现有的异常评论检测技术已经无法适应于当前的网络环境,无法有效抵御对抗性攻击。
发明内容
本申请提供了一种分类模型训练方法,其以包括评论数据的行为特征和内容特征的训练特征向量作为训练样本,对黑词库和分类模型进行迭代更新,从而训练得到能够有效抵御对抗性攻击的分类模型。基于该模型,本申请还提供了一种异常评论检测方法、与上述方法对应的装置、设备、存储介质以及计算机程序产品。
本申请第一方面提供了一种分类模型训练方法,所述方法包括:
获取语料集,根据所述语料集构建黑词库;
获取目标评论系统中的评论数据集,根据所述评论数据集扩充所述黑词库;
对所述评论数据集中各评论数据进行行为特征提取并根据所述黑词库进行内容特征提取,根据评论数据对应的行为特征和内容特征生成携带有类型标签的训练特征向量;
以所述评论数据集中各评论数据对应的训练特征向量作为训练样本,对分类模型进行多次迭代训练,通过当前迭代训练的分类模型对所述评论数据集中各评论数据进行预测,根据预测类型为异常的评论数据更新所述黑词库,基于更新后的黑词库更新所述训练样本,以进行下一次迭代训练直至所述分类模型和所述黑词库处于稳定态。
本申请第二方面提供一种异常评论检测方法,所述方法包括:
接收目标评论系统中待检测的评论数据;
通过分类模型检测所述评论数据的类型得到第一检测结果;和/或,通过黑词库检测所述评论数据的类型得到第二检测结果;其中,所述黑词库在所述分类模型的训练过程中迭代更新直至其处于稳定态;所述分类模型是基于所述历史评论数据和迭代更新的黑词库训练优化直至其处于稳定态;所述分类模型用于以评论数据对应的特征向量作为输入,以该评论数据对应的类型为输出,该类型用于表征该评论数据是否为异常评论,所述特征向量包括评论数据的行为特征和基于所述黑词库确定的内容特征;
发送所述评论数据对应的第一检测结果和/或第二检测结果。
本申请第三方面提供一种异常评论检测方法,所述方法包括:
调用分类模型的应用程序接口,对目标评论系统中的待检测的评论数据的类型进行检测得到第一检测结果;和/或,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910133882.1/2.html,转载请声明来源钻瓜专利网。