[发明专利]文件鉴定的方法及系统在审
申请号: | 202011287812.0 | 申请日: | 2020-11-17 |
公开(公告)号: | CN112380364A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 翁俊雯 | 申请(专利权)人: | 平安养老保险股份有限公司 |
主分类号: | G06F16/438 | 分类号: | G06F16/438;G06F16/435;G06F16/432;G06F16/2455;G06F40/216;G06K9/62;G06N3/04 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 王勇;邓小玲 |
地址: | 200120 上海市浦东新区自由*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 鉴定 方法 系统 | ||
本发明实施例提供了一种文件鉴定方法,包括:获取各端口上传的媒体文件,将所述媒体文件中的内容数据与所述媒体文件的附加信息分离,并列输入至预置的队列缓存区,所述附加信息为上传所述媒体文件的端口名称以及所述媒体文件的上传时间;对所述队列缓存区中的所述内容数据进行鉴定,根据鉴定结果创建所述媒体文件的第一级子元素;根据所述附加信息创建所述媒体文件的第二级子元素;读取所述第一级子元素,根据其所记载的鉴定结果向所述第二级子元素中所记载的端口发送上传结果。本发明使得用户上传信息在发布前得到有效鉴别,避免违规信息发布并且对上传信息进行结构存储,对违规发布者能够快速定位。
技术领域
本发明实施例涉及数据处理领域,尤其涉及一种文件鉴定的方法、系统、计算机设备及计算机可读存储介质。
背景技术
随着移动互联网技术的日趋成熟,网络媒体迎来发展热潮。用户对于咨询信息需求的不断提高促使网络媒体呈现多样化发展,从单纯地发布新闻资讯扩展到提供生活、娱乐、社会、财经等各方面内容。相比于传统媒体,网络媒体具有较高的自主性,言论尺度相对宽松,进而导致涉黄等违规图片和文章泛滥。
社交功能的拓展是当前趋势下各应用软件的迭代方向之一,开放用户社交平台,展现用户上传的图片或文章之前平台需要对上传文件进行存储,存储之前又需对待发布文章或者图片进行内容审核,剔除其中包含涉黄等违规内容的图片或者文章。然而,每日信息量庞大,文章可达百万篇,显然,采用传统的人工审核方式不仅产生的人力资源成本较高,而且无法在保证信息时效性的同时达到较为理想的效果,因此,如何基于文件内容鉴定完成数据存储是一个急需解决的问题。
发明内容
有鉴于此,本发明实施例的目的是提供一种文件鉴定的方法、系统、计算机设备及计算机可读存储介质,避免违规信息发布。
为实现上述目的,本发明实施例提供了一种文件鉴定的方法,包括以下步骤:
获取各端口上传的媒体文件,将所述媒体文件中的内容数据与所述媒体文件的附加信息分离,并列输入至预置的队列缓存区,所述附加信息为上传所述媒体文件的端口名称以及所述媒体文件的上传时间;
对所述队列缓存区中的所述内容数据进行鉴定,根据鉴定结果创建所述媒体文件的第一级子元素,所述第一级子元素用于记载所述鉴定结果对应的数值;
根据所述附加信息创建所述媒体文件的第二级子元素,所述第二级子元素用于记载所述附加信息中的所述媒体文件端口名称及上传时间;
读取所述第一级子元素,根据其所记载的鉴定结果向所述第二级子元素中所记载的端口发送上传结果。
优选的,所述将所述媒体文件中的内容数据与所述媒体文件的附加信息分离,并列输入至预置的队列缓存区的步骤包括:
分别对所述内容数据与所述附加信息进行封装,得到包含所述内容数据的第一封装包与包含所述附加信息的第二封装包;
所述队列缓存区预置有两条数据堆栈,将所述第一封装包输入至第一数据堆栈,将所述第二封装包输入第二数据堆栈。
优选的,所述对所述队列缓存区中的所述内容数据进行鉴定的步骤还包括:
提取所述内容数据,判断所述内容数据是否为文本类型,若是,则执行文本鉴定步骤;
若不是,则进行多媒体鉴定步骤。
优选的,所述文本鉴定步骤包括:
对所述内容数据进行文本预处理;
将处理后的内容数据进行特征提取,得到包含至少一个特征词的特征词数组;
将所述特征词数组输入至预制的文本训练模型中,文本训练模型根据各个特征词所对应的权重分数,计算所述内容数据的总分值并依据所述总分值输出所述内容数据的鉴定结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安养老保险股份有限公司,未经平安养老保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011287812.0/2.html,转载请声明来源钻瓜专利网。