[发明专利]分类模型训练方法、异常评论检测方法、装置及设备有效
申请号: | 201910133882.1 | 申请日: | 2019-02-22 |
公开(公告)号: | CN110162621B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 温蕊 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种分类模型训练方法,包括:获取语料集,根据语料集构建黑词库,获取目标评论系统中的评论数据集,根据评论数据集扩充所述黑词库,对评论数据集中各评论数据进行行为特征提取并根据黑词库进行内容特征提取,根据行为特征和内容特征生成携带有类型标签的训练特征向量;以评论数据集中各评论数据对应的训练特征向量作为训练样本,对分类模型进行多次迭代训练,通过当前迭代训练的分类模型对评论数据集中各评论数据进行预测,根据预测类型为异常的评论数据更新黑词库,基于更新后的黑词库更新所述训练样本,以进行下一次迭代训练直至所述分类模型和所述黑词库处于稳定态。本申请还公开了相应的异常评论检测方法、装置、设备及介质。 | ||
搜索关键词: | 分类 模型 训练 方法 异常 评论 检测 装置 设备 | ||
【主权项】:
1.一种分类模型训练方法,其特征在于,包括:获取语料集,根据所述语料集构建黑词库;获取目标评论系统中的评论数据集,根据所述评论数据集扩充所述黑词库;对所述评论数据集中各评论数据进行行为特征提取并根据所述黑词库进行内容特征提取,根据评论数据对应的行为特征和内容特征生成携带有类型标签的训练特征向量;以所述评论数据集中各评论数据对应的训练特征向量作为训练样本,对分类模型进行多次迭代训练,通过当前迭代训练的分类模型对所述评论数据集中各评论数据进行预测,根据预测类型为异常的评论数据更新所述黑词库,基于更新后的黑词库更新所述训练样本,以进行下一次迭代训练直至所述分类模型和所述黑词库处于稳定态。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910133882.1/,转载请声明来源钻瓜专利网。