[发明专利]一种信息内容监测方法及系统在审
申请号: | 202110901823.1 | 申请日: | 2021-08-06 |
公开(公告)号: | CN113360566A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 肖雪松;严骊;严帅;冷昱汉;龙胜海 | 申请(专利权)人: | 成都明途科技有限公司 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06F16/23;G06F16/951 |
代理公司: | 成都睿道专利代理事务所(普通合伙) 51217 | 代理人: | 周自维 |
地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息内容 监测 方法 系统 | ||
本发明提供了一种信息内容监测方法及系统,包括:获取用户设置的监测业务配置信息;根据所述监测业务配置信息进行解析后得到对应的采集任务,并将所述采集任务分配给对应的爬虫集群对目标网络数据进行数据采集,获得对应的数据集;通过风险指纹库对所述数据集进行分类审核,分析所述数据集中各类数据的违规风险,并根据所述违规风险将各类数据存入对应的风险数据库中;所述风险数据库包括风险库、无风险库和疑似风险库;将所述疑似风险库中的数据发送给人工审核系统进行复审并根据复审结果更新所述风险数据库,并同步数据至所述风险指纹库;将更新后的所述风险数据库中的信息进行可视化展示;降低了网络违规信息审核量的同时提高了审核效率。
技术领域
本发明涉及网络信息安全技术领域,具体而言,涉及一种信息内容监测方法及系统。
背景技术
目前,目前的各种针对各类有害低俗等节目内容的自动分析于此情况,一般都是采用如下的技术措施:
维护关键词库:通过维护一个巨大的关键词库,当文本内含有关键词库中的1:1关键词才可以检测出来。
针对相关信息是嵌入平台中做直接的信息过滤与拦截。
人工检测:通过招聘内容审核员等职位人员进行人工处理并且人工花费大量时间进行数据统计生成检测报告。
监管“黑名单”:监管系统多采用“黑名单”的方式,通过建立“有害节目内容库”,将涉嫌违规视听内容与库中关键帧对比完成识别。
但随着新媒体时代信息源的丰富性和数字化技术的便捷性,互联网中每时每刻都在产生形形色色的内容,由于分析手段单一,缺乏智能内容审核技术手段,导致人工参与审核的工作量大、效率低下、对严重违规内容发现处置不及时等问题。因此,需要提供一种方案以提高网络违规内容审核效率,降低审核者的工作量。
发明内容
本发明的目的在于提供一种信息内容监测方法及系统,用以实现提高网络违规内容审核效率并降低审核者的工作量的技术效果。
第一方面,本发明提供了一种信息内容监测方法,包括:
S1.获取用户设置的监测业务配置信息;
S2.根据所述监测业务配置信息进行解析后得到对应的采集任务,并将所述采集任务分配给对应的爬虫集群对目标网络数据进行数据采集,获得对应的数据集;
S3.通过风险指纹库对所述数据集进行分类审核,分析所述数据集中各类数据的违规风险,并根据所述违规风险将各类数据存入对应的风险数据库中;所述风险数据库包括风险库、无风险库和疑似风险库;
S4.将所述疑似风险库中的数据发送给人工审核系统进行复审并根据复审结果更新所述风险数据库,并同步数据至所述风险指纹库;
S5.将更新后的所述风险数据库中的信息进行可视化展示。
进一步地,所述方法还包括:
获取用户上传的指定内容并根据所述指定内容进行分类审核,分析所述指定内容中是否存在违规内容;
若所述指定内容中存在违规内容,则将违规内容存入对应的风险指纹库,并对数据进行清洗处理后生成对应的审核报告。
进一步地,所述指定内容至少包括指定内网数据、指定互联网内容、指定政府网数据和通过FTP上传的本地数据中的一种。
进一步地,所述方法还包括:S6. 获取用户的数据审查请求;S7. 根据所述数据审查请求将所述风险数据库中的数据通过数据列表进行展示。
进一步地,所述方法还包括:S8. 获取用户对所述数据列表的操作指令并根据所述操作指令对所述数据列表中的数据进行处理;所述操作指令至少包括筛选操作、导出操作和共享操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都明途科技有限公司,未经成都明途科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110901823.1/2.html,转载请声明来源钻瓜专利网。