[发明专利]文本处理系统、电子文本、文本处理方法以及程序在审
申请号: | 201280074372.8 | 申请日: | 2012-06-29 |
公开(公告)号: | CN104412255A | 公开(公告)日: | 2015-03-11 |
发明(设计)人: | 前田刚男 | 申请(专利权)人: | 株式会社战略经营研究所 |
主分类号: | G06F17/21 | 分类号: | G06F17/21 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 陈华成 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 处理 系统 电子 方法 以及 程序 | ||
技术领域
本发明涉及文本处理系统、电子文本、文本处理方法以及程序,详细而言,涉及通过使用文本数据和字体数据的对安全技术和压缩技术的改进。
背景技术
近年来,在一些文本处理系统以及电子文本中,有时采用能够使用ISO/IEC 10646(UCS)和Unicode的UTF-8。UTF-8是1字节代码单位的字符编码形式,为了具有与ASCII字符的互换性,对与ASCII相同的部分以1字节进行编码,对其他的部分以2~6字节进行编码。主要由ASCII字符构成的文本能够在几乎不增加数据大小的情况下享受Unicode的优点。
但是,在计算机当中的字符的交换是以基于编码技术而被标准化了的字符代码为基础来进行的。随着被标准化的字符数(字形数)增加,由计算机处理的数据量也增加。为了解决数据量增加的问题,还存在用于高效地处理字符代码的编码方式。在这样的编码方式中,通过例如使字节数可变,来减小数据量,所以关于字符代码的最先的编号具有小的数据量,关于最后的字符具有大的数据量。例如字母“a”利用0和1来表现为“01100001”(1字节:控制比特数1+代码比特数7),然而“日”则表现为“111001101001011110100101”(3字节:控制比特数8+代码比特数16)。
在UTF-8的构造中的最大的数据宽度为:
“111111011011111110111111101111111011111110111111”(6字节:控制比特数17+代码比特数31)。此时,能够处理超20亿的字符。
另外通过采用由Unicode定义了的异体字选择器,能够切换字形。异体字选择器在Unicode中通过“U+FE00~U+FE0F”以及“U+E0100~U+E01EF”的256字符代码位置来指定,并且在UTF-8中采用3字节~4字节。异体字选择器通过接着基本字符排列,能够表示与基本字形不同的字形。
在字符编码方式中,除UTF-8之外还存在与Unicode对应了的UTF-16、UTF-32、Shift-JIS、EUC等各种种类,其中大多采用字节数根据字符代码位置而可变的方式。另外,也存在仅通过采用如URL编码的ASCII字符来表示各种字符的方式。
另外,关于在计算机方面的安全,使用根据标准的字符代码,针对字符代码的数据采用加密技术等,采取对策以防止内容向外部泄漏。然而,加密技术以在计算机上执行的解码为前提,并且如果弄清了密码的破译方法,则待进行通信的数据的内容被全部破译。
另外,防止主要由电子书籍这样的字符构成的内容被复制在实际上是困难的。进而,为了避免用于表现语句的字体数据通过数字复制而外流,该字体数据无法灵活利用于电子书籍。因此,在电子媒体中,诸如类型设计(designs of types)的表现趋向于受损。
在专利文献1中,记载了文本处理系统,该文本处理系统通过随机地更换示出字体内部的字符码和点符(glyph)的对应关系的表格而创建专用字体,并将电子文本的字符码更换成专用字体的编码系统,以使得在未安装有该专用字体的计算机中,通过使电子文本乱码化而仅隐藏字符部分。
另一方面,PDF具有能够将字符数据嵌入PDF数据中的特征。通过生成PDF文件并嵌入字体信息,能够由所生成的文本自身保持字体信息。由此,即使是在输出侧的终端中没有的字体,也能够可靠地输出,并且能够实现再现性优良的文本。关于字体的嵌入,存在仅嵌入被使用的字体的“子集嵌入”、和全部嵌入字体中包含的字符的“完全嵌入”(complete embedding)。
在专利文献2中,记载了信息处理装置,该信息处理装置基于创建了其中反映了图形以及字符的编辑指示的电子文本,进行关于是否嵌入字体信息的询问。
现有技术文献
专利文献
专利文献1:特开2007-109158号公报
专利文献2:特开2006-107033号公报
发明内容
然而,关于这样的以往的文本处理系统,存在以下的问题。
在专利文献1记载的文本处理系统中,必须预先创建用于改变字符码与字体的对应关系的变换表格。关于这样的变换表格,预计取决于文本的种类或者用户的使用环境而会有较大的不同。预先创建满足所有这些要求的变换表格存在耗费劳力和成本的问题。为了提高变换的效率,必须预先创建数据量大的变换表格。进而,还必须构筑用于更新所述变换表格的构造。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社战略经营研究所,未经株式会社战略经营研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280074372.8/2.html,转载请声明来源钻瓜专利网。