[发明专利]基于候选池自收缩机制的文本自动生成隐写方法在审
申请号: | 201911004851.2 | 申请日: | 2019-10-16 |
公开(公告)号: | CN111859407A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 沈阳工业大学 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 110087 辽宁省沈阳市沈*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 候选 收缩 机制 文本 自动 生成 方法 | ||
本发明公开了一种基于候选池自收缩机制的文本自动生成隐写方法。该方法可以根据需要隐藏的秘密比特流生成高质量的含有隐秘信息的文本载体。区别于以往的文本隐写方法,本方法的创新点在于候选池基于困惑度计算的自收缩机制。该方法在隐写文本自动生成过程中,充分利用神经网络对词的打分,考虑了对于上下文来说,不同词语的敏感度不同,引入基于困惑度计算的自收缩机制,提高了隐写系统的隐蔽性和生成的隐写文本的可读性。
技术领域
本发明涉及信息隐藏、大数据、深度学习、自然语言处理等领域,特别涉及一种基于候选池自收缩机制的文本自动生成隐写方法。
背景技术
当今社会处在“大数据时代”,这是一种新型能力。即以一种方式对海量数据进行分析,获得巨大价值的产品或服务。在大数据时代,我们可以分析更多的数据,甚至可以处理和某个特别现象相关的所有数据。大数据的核心是预测,将数学算法运用到海量数据上预测事情发生的可行性。文本作为人们日常使用最频繁的交流方式,海量的文本数据随着大数据时代的到来产生了巨大的价值。数据安全保障的问题随之产生。
网络安全管理的思路普遍是“严防死堵,物理隔离”。目前传统的信息安全主要是围绕加密技术及体系完成的。加密技术是指发送方将一个信息(明文),通过密钥以及加密函数转换为无意义的密文。接收方将受到的密文通过解密函数和密钥还原成明文。加密技术已经形成了较为完善的体系与管理方式,但是进入大数据时代之后,加密技术暴露出一些缺陷。由于密文容易被攻击者关注,攻击者只需对密文进行解密就可得到所传输的原文。信息隐藏将信息进行伪装,既使发送方发送的数据与普通数据相似,不易被攻击者关注,又可以保证秘密信息的内容安全。
信息隐藏也称作数据隐藏,它主要是通过一个秘密信息嵌入公开传输的载体,得到一个与普通数据没有差异的数据,保证了秘密信息的不可感知性和安全性。公开传输的载体可为图片、音视频、文本等。文本作为人们日常生活中使用最广泛的信息载体,具有更高程度的信息编码。但由于文本的冗余性较低,使得利用文本隐藏秘密信息非常具有挑战性。
基于文本信号的信息隐藏主要分为两大类:一类是通过改变文本格式(如字间距、字母大小写等)进行秘密信息的隐藏;另一类则是通过载体生成技术,将一段需要隐藏的秘密信息通过一个文本生成器,产生一段有意义的自然文本。改变文本格式后的文本可读性高,但可修改空间小,难以实现足够高的隐藏容量。通过载体生成的信息隐藏技术具有较高的隐写容量,但是容易产生生成的隐写文本可读性低、易被识别的缺陷。如盒设计文本生成器,提高生成文本的自然程度、使攻击者不易察觉成为该领域亟待解决的问题。
深度学习(Deep Learning,DL)的概念源于人工神经网络(Artificial NeuralNetwork,ANN)的研究。其人工神经网络是从信息处理的角度对人脑神经元网络进行抽象,建立简单模型,并通过不同的连接方式组成不同的网络,简称神经网络(Neural Network,NN),如图1所示。深度学习又叫深度神经网络,是一种基于对数据进行表征学习的方法。换句话说,深度学习能够模拟人脑的神经结构解释数据,比如图像、音视频和文本等。其主要通过构建具有很多隐含层的机器学习模型和海量的训练数据学习特征,从而实现分类或预测的准确性。它既强调了模型结构的深度,即从“输入层”到“输出层”所经历层次的数目,层数越多,深度也就越深;同时也突出了特征学习的重要性,通过逐层特征提取,将样本原油的特征变换到新的特征空间。与人工提取的特征相比,利用深度学习提取特征,不但节省人力,且能够刻画数据的内在信息。
循环神经网络(Recurrent Neural Network,RNN)是一类适用于以序列数据为,在序列的演进方向递归,且所有循环单元按链式链接的神经网络。其主要特点是神经元的输出再下一时刻直接作用在自身。即隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。这使得该网络具有记忆性。如图2所示。其深度体现在时间域。相比较其他深度、前馈神经网络,循环神经网络通过使用带自反馈的神经单元,能够处理任意长度的序列数据,是一种颇具吸引力的深度学习结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳工业大学,未经沈阳工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911004851.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:手持式刨子
- 下一篇:基于动态路由胶囊网络的文本隐写分析方法