[发明专利]一种部件直方图的文本无载体隐写方法与装置有效
申请号: | 202110302391.2 | 申请日: | 2021-03-22 |
公开(公告)号: | CN112966282B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 黄华军;曾笛;陈芳 | 申请(专利权)人: | 湖南财政经济学院;中南林业科技大学 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F16/31 |
代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 王月松 |
地址: | 410000 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 部件 直方图 文本 载体 方法 装置 | ||
本发明公开了一种部件直方图的文本无载体隐写方法与装置,包括:步骤1:文本库的码本构建;步骤2:秘密信息预处理;步骤3:基于随机文本选择的隐藏方法;步骤4:信息隐藏;步骤5:秘密索引的构建;步骤6:秘密信息的提取。与现有文本无载体信息隐藏技术相比,本发明至多能将所有秘密信息隐藏在一个文本中,大幅度提高了隐藏容量,且在提取过程中利用混合索引结构而非自然语言处理的方法,增大了隐藏成功率。
技术领域
本发明属于信息安全技术领域,尤其涉及一种基于部件直方图的文本无载体信息隐藏方法。
背景技术
网络与通信技术的发展极大地推动了生产力变革,成为社会发展不可或缺的支柱力量。受互联网的开放性特点影响,数据安全面临的风险日益复杂,通信活动的隐蔽性和安全性亟待加强。
其中,技术方案——Chen X,Sun H,et al.Coverless Information HidingMethod Based on the Chinese Mathematical Expression.公开了以汉字数学表达式为基本理论,将秘密信息进行分词,利用字转换协议,转换为新的关键词;再设计定位标签协议,从而生成包含转换后的关键词以及定位标签的组合,通过搜索包含数据库中组合的文本,达到信息隐藏的目的。
但是,目前传统的基于搜索的文本无载体信息隐藏,传输载体为文本,一个文本平均只能隐藏一个关键字,导致隐藏容量低,在提取过程中,运用的自然语言处理方法会存在歧义和二义性等问题,使得隐藏成功率下降。
因此,提供一种信息隐藏容量大、隐藏成功率高的无载体信息隐藏方法是本领域技术人员亟需解决的问题。
发明内容
本发明针对目前无载体信息隐藏存在的信息隐藏容量小、隐藏成功率低的问题,提出一种部件直方图的文本无载体隐写方法与装置,显著提升了隐藏成功率与隐藏容量。
为了实现上述目的,本发明采用以下技术方案:
一种部件直方图的文本无载体隐写方法与装置,其特征在于,包括:
步骤1:文本库的码本构建;
步骤2:秘密信息预处理;
步骤3:基于随机文本选择的隐藏方法;
步骤4:信息隐藏;
步骤5:秘密索引的构建;
步骤6:秘密信息的提取。
优选的,文本的无载体信息隐藏依托于文本数据库,本文选取搜狗实验室公开的新闻数据集作为文本载体库,通过构建文本库中每篇文本的部件直方图作为信息隐藏的码本,文本的部件直方图的概念是由图像的灰度直方图引申而来,部件直方图是部件级的函数,能够反映出文本中所有部件的统计分布特征,文本的部件直方图由部件编号、部件频次以及部件频次的排名(即部件的阶)三部分构成;
部件直方图CFR(Component-Frequency-Rank)定义如下:
CFR={ci,fci,rci|i=1,2,3…,U} (2.1)
其中,U是部件总数,是部件编号,是部件出现的次数,是部件在这篇文本部件直方图中的阶;
具体生成方法为:将文本里的所有汉字转换为汉字数学表达式,然后统计文本中所有汉字的数学表达式中的部件,得到所有部件在该文本中出现的次数,最后以部件编号为横坐标,以部件频次为纵坐标,按照部件出现的频次排序做出统计图,就得到了文本汉字的部件直方图;它能直观地表示某一篇文本中出现的所有部件的次数以及排名情况;具体方法如下:
步骤1.1:遍历文本库中所有文本,将每篇文本生成唯一的哈希值作为文本编号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南财政经济学院;中南林业科技大学,未经湖南财政经济学院;中南林业科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110302391.2/2.html,转载请声明来源钻瓜专利网。