[发明专利]一种文本安全分割方法在审
申请号: | 201910618685.9 | 申请日: | 2019-07-10 |
公开(公告)号: | CN110378136A | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 王剑;何欣;卢文达;周洋;陈政波;邱兰馨;刘秀;徐亦白;赖晓翰;周梦兰;包迅格;冯烛明;魏骁;戚浩金;王勇;王彬栩;杨跃平;张全;邢雅菲;于晓蝶;潘富城;冉清文;琚小明 | 申请(专利权)人: | 华东师范大学;国网浙江省电力有限公司;国网浙江省电力有限公司宁波供电公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F17/27;H04L9/08 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 原文 密钥 分割 安全保证 传输提供 过程模型 密钥空间 提取参数 文本访问 文本分割 子空间 子密钥 分层 映射 填充 投影 存储 安全 创建 恢复 | ||
本发明公开了一种文本安全分割方法,该方法包括:步骤A:使用基于分层狄利克雷过程模型的文本分割方法将原文本分割成不同主题的段落;步骤B:将原文本看成是密钥空间中的一个密钥,将此密钥向子空间作映射投影即得到子密钥,也就是从原文本得到了它的子文本;步骤C:以恢复文本所需的子文本个数作为输入,经过提取参数、创建子文本访问表、填充原文本步骤后,得到原文本。本发明为重要文本的存储和传输提供了安全保证。
技术领域
本发明属于文本分割领域,尤其涉及一种文本安全分割方法。
背景技术
随着网络的快速发展,人们逐渐跨入全新的网络时代,各种电子文本信息更是以爆炸性的速度增长。海量信息带来便利的同时,也为文本安全存储带来了巨大的挑战。密钥分存是近代的一个重要话题,它旨在解决这样的问题,即如何将密钥合理划分成几个子密钥来分配,使得只有利用其中达到指定数目的任意几个子密钥才能将原密钥回复,从而解出明文。
文本分割的任务隶属于文本处理范畴,所以对于文本处理的典型步骤文本分割都是必不可少的。传统的文本分割旨在将一个较大尺寸的文本均匀分割成几个较小尺寸的子文本,以便于通过网络软件的文本传输系统进行文本传输。从功能和目的来讲传统的文本分割对文本起了化大为小,便于传输的作用。从实现方面来讲,传统文本分割方法只是简单的均匀分割,易于实现。从效率角度而言,传统文本分割方法的时间复杂度为()。目前,在理论思想上,文本分割技术主要分为四类:基于词汇聚集的思想、基于统计的思想、基于语言特征信息的思想以及将三者结合的思想,这些思想为很多分割算法奠定了坚实的基础。越来越多的学者探索将能反应文本语义信息的主题模型用于文本分割,并取得了较好的效果。
发明内容
本发明的目的提供一种文本安全分割方法,给出一种应用于实际保密场合的文本安全分割及恢复方法。实现将文本分割成个子文本,利用其中任意(1<<)个子文本可以恢复原文本,为重要文件的存储和传输提供了安全保证。
实现本发明目的的具体技术方案是:
一种文本安全分割方法,该方法包括以下具体步骤:
步骤A:使用基于分层狄利克雷模型的文本分割方法将原文本分割成不同主题的段落;
步骤B:将原文本看成是密钥空间中的一个密钥,将此密钥向子空间作映射投影即得到子密钥,也就是从原文本得到了它的子文本;
步骤C:经过提取参数、创建子文本访问表、填充原文本步骤后,得到原文本。
进一步,步骤A,使用一种基于分层狄利克雷模型的文本分割方法,具体的实现步骤为:
S11,对文本进行预处理
S111,对文本进行词语切分和词性的标注,去除文本中的虚词、数词和量词,提取名词、动词、形容词和代词,最终得到一个切分好的带词性标注的文本。
S12,基于分层狄利克雷模型的文本分割
S121,分层狄利克雷模型在每次迭代过程中都会采样为每个词分配主题ID代替词表示文本,主题向量的形式可表示为:S=(t1,t2,...,tz),ti,(i=1,2,...,z)为某主题ID在文本中出现的频率;z为分层狄利克雷模型自动聚类产生的主题个数。
S122,原文本的每句话都已用主题向量表示,在向量间隙的左侧和右侧使用名为块的K个主题向量,应用余弦相似性以基于每个向量间隙处的相邻块的主题频率计算相似性得分Score,具体算法为:
Score=(Si*Sj)/(|Si|*|Sj|)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学;国网浙江省电力有限公司;国网浙江省电力有限公司宁波供电公司,未经华东师范大学;国网浙江省电力有限公司;国网浙江省电力有限公司宁波供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910618685.9/2.html,转载请声明来源钻瓜专利网。