[发明专利]基于候选池自收缩机制的文本自动生成隐写方法在审
申请号: | 201911004851.2 | 申请日: | 2019-10-16 |
公开(公告)号: | CN111859407A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 沈阳工业大学 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 110087 辽宁省沈阳市沈*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 候选 收缩 机制 文本 自动 生成 方法 | ||
1.基于候选池自收缩机制的文本自动生成隐写方法,包括以下步骤:
(1)通过爬取网上大量常见自然文本,构建文本数据集作为训练集;
(2)对数据进行预处理,英文自然文本的存在形式为全部小写,只保留字母和数字;
(3)对训练集中的文本进行建模,构建循环神经网络模型,并通过反向传播算法对模型的性能进行优化;
(4)测试模型的loss值,根据loss值调整模型训练参数;
(5)重复步骤(3)~(4),直到神经网络模型参数和性能达到稳定;
(6)统计训练集中每个句子第一个词的词频分布,并选择词频最高的前200个词构成起始词列表;
(7)每次生成一句隐写文本时,随机从起始词列表中选择一个词作为起始词,标志着隐写文本生成的开始;
(8)通过调整好的循环神经网络模型以及选定第一个词,迭代式计算各时刻词的条件概率分布;
(9)在每个时刻t,根据迭代式计算的词的条件概率依降序排列和训练好的统计语言模型计算每个词结合前t-1个词时整个句子的得分,并将词进行归一化处理;
(10)根据预设的嵌入率对确定候选池大小;
(11)确定候选池的大小后,通过该时刻t与前t-1个时刻的条件概率分布进行困惑度计算;
(12)依据预设困惑度对候选池进行筛选,由于筛选过后的候选池单词数量不固定,具有自收缩的性质;
(13)若该时刻候选池中各词的困惑度均大于预设困惑度,则选取当前时刻得分最高的单词作为当前时刻的输出;
(14)根据需要嵌入的码流从编码表中搜索,与嵌入码流匹配的编码对应的单词为当前时刻的输出,实现在生成隐写文本的过程中隐藏秘密信息;
(15)重复步骤(8)~(14),直到生成一个完整的隐写句子,完成根据秘密信息自动生成隐写文本的过程;
(16)接收方在接收到模型生成的隐写文本后,对其进行解码并获取机密消息。
2.如权利要求1所述的基于候选池自收缩机制的文本自动生成隐写方法,其特征在于,如步骤(11)(12)(13)所述,实现了候选池的自适应收缩机制,提升了隐写系统的隐蔽性和生成的隐写文本的可读性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳工业大学,未经沈阳工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911004851.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:手持式刨子
- 下一篇:基于动态路由胶囊网络的文本隐写分析方法