[发明专利]一种文本类电子证据的特征提取方法及系统在审
申请号: | 202310651059.6 | 申请日: | 2023-06-02 |
公开(公告)号: | CN116611421A | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 杨珂;陈鹏;郭庆雷;王合建;李永亮;杨成;高博;李学锋;于晓昆;马小小 | 申请(专利权)人: | 国网数字科技控股有限公司;国网区块链科技(北京)有限公司;国网宁夏电力有限公司;国网宁夏电力有限公司电力科学研究院;国家电网有限公司 |
主分类号: | G06F40/20 | 分类号: | G06F40/20;G06F16/35;G06N3/0464;G06N3/048;G06N3/08;G06Q50/18 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 崔清杨 |
地址: | 100053 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 电子 证据 特征 提取 方法 系统 | ||
本发明提供了一种文本类电子证据的特征提取方法及系统,该方法为:利用预设的词向量模型处理文本类电子证据,以提取得到文本类电子证据的原始特征词向量;将原始特征词向量输入预设的卷积神经网络进行特征提取,以提取得到文本类电子证据的特征。本方案中,先利用词向量模型提取文本类电子证据的原始特征词向量,再利用预设的卷积神经网络对原始特征词向量进行特征提取以提取得到文本类电子证据的特征,从而提高提取文本特征的准确性和精度。
技术领域
本发明涉及深度学习技术领域,具体涉及一种文本类电子证据的特征提取方法及系统。
背景技术
随着移动互联网的高速发展,网络上产生的文本类电子证据的信息量急剧增长,如何高效地从文本类电子证据中提取出有用的信息是文本检索和数据挖掘等技术首要解决的问题。
目前通常采用诸如词频统计等传统文本特征提取方法来提取文本类电子证据的特征,但是前述传统文本特征提取方法难以处理文本中的复杂关系和非线性特征,提取文本特征的准确性较差和精度较差。
发明内容
有鉴于此,本发明实施例提供一种文本类电子证据的特征提取方法及系统,以解决传统文本特征提取方法存在的提取文本特征的准确性较差和精度较差等问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开一种文本类电子证据的特征提取方法,所述方法包括:
利用预设的词向量模型处理文本类电子证据,以提取得到所述文本类电子证据的原始特征词向量;
将所述原始特征词向量输入预设的卷积神经网络进行特征提取,以提取得到所述文本类电子证据的特征,所述卷积神经网络模型包含输入层、卷积层、池化层和全连接层,所述卷积层包含N个卷积核大小不同的普通卷积层和M个空洞率不同的空洞卷积层。
优选的,将所述原始特征词向量输入预设的卷积神经网络进行特征提取,以提取得到所述文本类电子证据的特征,包括:
将所述原始特征词向量进行拼接以形成词向量矩阵;
通过预设的卷积神经网络的输入层将所述词向量矩阵传递给所述卷积神经网络的卷积层;
利用所述卷积层对所述词向量矩阵进行特征提取以得到一组一维特征向量,并将提取得到的所述一组一维特征向量传递给所述卷积神经网络的池化层;
利用所述池化层对所述一组一维特征向量进行L2范数归一化以得到归一化后的特征向量,并将所述归一化后的特征向量传递给所述卷积神经网络的全连接层;
利用所述全连接层处理所述归一化后的特征向量以得到所述文本类电子证据的特征。
优选的,利用所述全连接层处理所述归一化后的特征向量以得到所述文本类电子证据的特征,包括:
利用配置有Dropout算法的所述全连接层处理所述归一化后的特征向量以得到所述文本类电子证据的特征。
优选的,所述卷积层所包含的第一个普通卷积层和第一个空洞卷积层配置LeakyRelu激活函数,所述卷积层所包含的第二个普通卷积层和第二个空洞卷积层配置tanh激活函数。
优选的,所述方法还包括:
将所述文本类电子证据的特征上传至区块链上。
本发明实施例第二方面公开一种文本类电子证据的特征提取系统,所述系统包括:
第一提取单元,用于利用预设的词向量模型处理文本类电子证据,以提取得到所述文本类电子证据的原始特征词向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网数字科技控股有限公司;国网区块链科技(北京)有限公司;国网宁夏电力有限公司;国网宁夏电力有限公司电力科学研究院;国家电网有限公司,未经国网数字科技控股有限公司;国网区块链科技(北京)有限公司;国网宁夏电力有限公司;国网宁夏电力有限公司电力科学研究院;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310651059.6/2.html,转载请声明来源钻瓜专利网。