[发明专利]一种文本类电子证据的特征提取方法及系统在审
申请号: | 202310651059.6 | 申请日: | 2023-06-02 |
公开(公告)号: | CN116611421A | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 杨珂;陈鹏;郭庆雷;王合建;李永亮;杨成;高博;李学锋;于晓昆;马小小 | 申请(专利权)人: | 国网数字科技控股有限公司;国网区块链科技(北京)有限公司;国网宁夏电力有限公司;国网宁夏电力有限公司电力科学研究院;国家电网有限公司 |
主分类号: | G06F40/20 | 分类号: | G06F40/20;G06F16/35;G06N3/0464;G06N3/048;G06N3/08;G06Q50/18 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 崔清杨 |
地址: | 100053 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 电子 证据 特征 提取 方法 系统 | ||
1.一种文本类电子证据的特征提取方法,其特征在于,所述方法包括:
利用预设的词向量模型处理文本类电子证据,以提取得到所述文本类电子证据的原始特征词向量;
将所述原始特征词向量输入预设的卷积神经网络进行特征提取,以提取得到所述文本类电子证据的特征,所述卷积神经网络模型包含输入层、卷积层、池化层和全连接层,所述卷积层包含N个卷积核大小不同的普通卷积层和M个空洞率不同的空洞卷积层。
2.根据权利要求1所述的方法,其特征在于,将所述原始特征词向量输入预设的卷积神经网络进行特征提取,以提取得到所述文本类电子证据的特征,包括:
将所述原始特征词向量进行拼接以形成词向量矩阵;
通过预设的卷积神经网络的输入层将所述词向量矩阵传递给所述卷积神经网络的卷积层;
利用所述卷积层对所述词向量矩阵进行特征提取以得到一组一维特征向量,并将提取得到的所述一组一维特征向量传递给所述卷积神经网络的池化层;
利用所述池化层对所述一组一维特征向量进行L2范数归一化以得到归一化后的特征向量,并将所述归一化后的特征向量传递给所述卷积神经网络的全连接层;
利用所述全连接层处理所述归一化后的特征向量以得到所述文本类电子证据的特征。
3.根据权利要求2所述的方法,其特征在于,利用所述全连接层处理所述归一化后的特征向量以得到所述文本类电子证据的特征,包括:
利用配置有Dropout算法的所述全连接层处理所述归一化后的特征向量以得到所述文本类电子证据的特征。
4.根据权利要求1至3中任一所述的方法,其特征在于,所述卷积层所包含的第一个普通卷积层和第一个空洞卷积层配置LeakyRelu激活函数,所述卷积层所包含的第二个普通卷积层和第二个空洞卷积层配置tanh激活函数。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述文本类电子证据的特征上传至区块链上。
6.一种文本类电子证据的特征提取系统,其特征在于,所述系统包括:
第一提取单元,用于利用预设的词向量模型处理文本类电子证据,以提取得到所述文本类电子证据的原始特征词向量;
第二提取单元,用于将所述原始特征词向量输入预设的卷积神经网络进行特征提取,以提取得到所述文本类电子证据的特征,所述卷积神经网络模型包含输入层、卷积层、池化层和全连接层,所述卷积层包含N个卷积核大小不同的普通卷积层和M个空洞率不同的空洞卷积层。
7.根据权利要求6所述的系统,其特征在于,所述第二提取单元包括:
拼接模块,用于将所述原始特征词向量进行拼接以形成词向量矩阵;
传递模块,用于通过预设的卷积神经网络的输入层将所述词向量矩阵传递给所述卷积神经网络的卷积层;
第一处理模块,用于利用所述卷积层对所述词向量矩阵进行特征提取以得到一组一维特征向量,并将提取得到的所述一组一维特征向量传递给所述卷积神经网络的池化层;
第二处理模块,用于利用所述池化层对所述一组一维特征向量进行L2范数归一化以得到归一化后的特征向量,并将所述归一化后的特征向量传递给所述卷积神经网络的全连接层;
第三处理模块,用于利用所述全连接层处理所述归一化后的特征向量以得到所述文本类电子证据的特征。
8.根据权利要求7所述的系统,其特征在于,所述第三处理模块具体用于:利用配置有Dropout算法的所述全连接层处理所述归一化后的特征向量以得到所述文本类电子证据的特征。
9.根据权利要求6至8中任一所述的系统,其特征在于,所述卷积层所包含的第一个普通卷积层和第一个空洞卷积层配置LeakyRelu激活函数,所述卷积层所包含的第二个普通卷积层和第二个空洞卷积层配置tanh激活函数。
10.根据权利要求6所述的系统,其特征在于,所述系统还包括:
上传单元,用于将所述文本类电子证据的特征上传至区块链上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网数字科技控股有限公司;国网区块链科技(北京)有限公司;国网宁夏电力有限公司;国网宁夏电力有限公司电力科学研究院;国家电网有限公司,未经国网数字科技控股有限公司;国网区块链科技(北京)有限公司;国网宁夏电力有限公司;国网宁夏电力有限公司电力科学研究院;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310651059.6/1.html,转载请声明来源钻瓜专利网。