[发明专利]基于深度学习的非结构化数据判决方法和装置有效
申请号: | 201610950494.9 | 申请日: | 2016-10-26 |
公开(公告)号: | CN107992937B | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 朱跃生;罗桂波 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06F16/35 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 谢曲曲 |
地址: | 518055 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 结构 数据 判决 方法 装置 | ||
本发明涉及一种基于深度学习的非结构化数据判决方法,具体包括:获取训练后的深度学习神经网络模型,其中所述训练后的深度学习神经网络模型为经多因子训练样本数据训练后的多因子联合判决的神经网络模型;接收在线实时采集的线索数据,所述线索数据包括多种数据类型的非结构化数据;通过训练后的深度学习神经网络模型对获取的所述线索数据进行联合分析,提取有利于判决的特征线索性信息;根据所述特征线索信息对所述线索数据进行判决,生成判决结果;反馈所述判决结果。上述方法能够对非结构化数据进行更加高效、更加及时的决策分析,实现在线实时分析。
技术领域
本发明涉及人工智能技术领域,特别是涉及一种基于深度学习的非结构化数据判决方法和装置。
背景技术
相对于结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、标准通用标记语言下的子集XML、HTML、各类报表、图像和音频/视频信息等等。非结构化数据具有数据量大、变化快、种类多、内容丰富复杂以及结构不统一的特点。
传统技术中由于非结构化数据的变化快、结构不统一等特点,对非结构化数据进行数据分析时存在分析耗时较长,一般都是对历史数据进行离线分析,分析决策效率低。
发明内容
基于此,有必要针对上述的问题,提供一种能够对非结构化数据进行更加高效、更加及时的在线决策分析的基于深度学习的非结构化数据判决方法和装置。
一种基于深度学习的非结构化数据判决方法,所述方法包括:
获取训练后的深度学习神经网络模型,其中,所述训练后的深度学习神经网络模型为经多因子训练样本训练的多因子联合判决神经网络模型;
接收在线实时采集的线索数据,所述线索数据为包括多种数据类型的非结构化数据;
通过所述训练后的深度学习神经网络模型对接收的所述线索数据进行联合分析,提取有利于判决的特征线索信息;
根据所述特征线索信息对所述线索数据进行判决,生成判决结果;
反馈所述判决结果。
在一个实施例中,所述通过所述训练后的深度学习神经网络模型对接收的所述线索数据进行联合分析,提取有利于判决的特征线索信息的步骤包括:
通过所述训练后的深度学习神经网络模型对接收的所述线索数据进行特征提取,得到高维特征向量;
采用散列检索算法将所述高维特征向量转化成带有各维度关联关系的散列码,并根据所述散列码进行有利于判决的特征线索信息的提取。
在一个实施例中,在所述获取训练后的深度学习神经网络模型,其中,所述训练后的深度学习神经网络模型为经多因子训练样本训练的多因子联合判决神经网络模型的步骤之前,还包括:
接收终端上传的训练样本,其中,所述训练样本数据为多因子训练样本;
在离线状态下,利用深度学习算法对所述多因子训练样本中每个因子对应的训练样本构建深度学习神经网络子模型;
获取构建的所述深度学习神经网络子模型之间的关联关系;
根据所述关联关系融合所述深度学习神经网络子模型,生成可进行多因子联合决策的深度学习神经网络模型。
在一个实施例中,所述多因子训练样本包括视频数据、图像数据、音频数据、文本数据和网络数据。
在一个实施例中,当在设定时间内接收的所述线索数据包含一种数据类型时,则使用所述数据类型对应的所述因子的深度学习神经网络子模型对所述线索数据进行分析判决,得到判决结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610950494.9/2.html,转载请声明来源钻瓜专利网。