[发明专利]目标对象处理方法、装置、电子设备及存储介质在审
申请号: | 202111240961.6 | 申请日: | 2021-10-25 |
公开(公告)号: | CN114065002A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 张建;王珍珠 | 申请(专利权)人: | 北京淘友天下科技发展有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/906 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 对象 处理 方法 装置 电子设备 存储 介质 | ||
本申请实施例提供了一种目标对象处理方法、装置、电子设备及存储介质,涉及数据处理技术领域。该方法包括:确定待监测对象中的目标对象;获取目标对象的会话数据;对会话数据进行分类,得到会话数据的类别信息;基于类别信息统计会话数据,并根据统计结果对会话数据所对应的目标对象进行处理。本申请实施例实现了根据会话数据的统计结果对目标对象进行处理,提高了针对目标对象的内容审核效率。
技术领域
本申请涉及数据处理技术领域,具体而言,本申请涉及一种目标对象处理方法、装置、电子设备及计算机可读存储介质。
背景技术
随着互联网运用的发展,网络用户的交互作用得以体现,用户既是网络内容的浏览者,也是网络内容的创造者。在web2.0(World Wide Web,万维网)时代,互联网上的内容正在飞速增长,形成一个多、广、专的局面,对人类知识的积累和传播起到了一个非常大的作用,但要注意的是,因为每一个人都可以生成内容,可能会有很多错误、虚假和片面的内容,故进行内容审核至关重要。
现有技术中,通过设置关键词的方式对网络用户的会话内容进行筛查,当网络会话内容命中关键词,则认为该网络用户涉及风险活动。然而,基于关键词匹配的方式针对网络用户即目标对象进行内容审核,关键词质量难以控制,存在内容审核结果准确率较低的问题。
发明内容
本申请实施例提供了一种目标对象处理方法、装置、电子设备及计算机可读存储介质,以解决现有技术中,基于关键词对网络会话审核的方式,准确率较低的问题。
根据本申请实施例的一个方面,提供了一种目标对象处理方法,该方法包括:
确定待监测对象中的目标对象;
获取目标对象的会话数据;
对会话数据进行分类,得到会话数据的类别信息;
基于类别信息统计会话数据,并根据统计结果对会话数据所对应的目标对象进行处理。
可选地,上述确定待监测对象中的目标对象,包括:
从预设数据库中获取待监测对象的属性信息;
将满足预设筛选条件的属性信息对应的待监测对象,作为目标对象。
可选地,上述方法还包括:
通过消息系统获取待监测对象的活动日志数据;其中,活动日志数据指示待监测对象的行为信息;
基于数据流引擎对活动日志数据进行计算,确定待监测对象的属性信息;
将属性信息存入数据库。
可选地,上述对会话数据进行分类,得到会话数据的类别信息,包括:
对会话数据进行预处理,确定文本信息;
基于预训练的分类器对文本信息进行分类,得到类别信息。
可选地,上述分类器是基于如下方式训练得到的,包括:
获取预设的样本文本信息和样本文本信息对应的样本类别;
将样本文本信息输入到初始分类器,得到初始分类器实时输出的类别标签;
基于预设的损失函数计算类别标签和样本类别的差值,并实时调整初始分类器的参数,当差值小于预设阈值,确定分类器。
可选地,上述基于类别信息统计会话数据,包括:
当类别信息为预设的目标类别,将类别信息对应的会话数据作为目标数据;
统计目标数据的数量以及目标数据在所有会话数据中的占比。
可选地,上述对会话数据所对应的目标对象进行处理,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京淘友天下科技发展有限公司,未经北京淘友天下科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111240961.6/2.html,转载请声明来源钻瓜专利网。