[其他]计算机汉(文)字快速处理系统在审
申请号: | 101985000009039 | 申请日: | 1985-12-13 |
公开(公告)号: | CN1004034B | 公开(公告)日: | 1989-04-26 |
发明(设计)人: | 许素兰 | 申请(专利权)人: | 许素兰 |
主分类号: | 分类号: | ||
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 北京市海淀区塔*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机 快速 处理 系统 | ||
一种计算机汉(文)字快速处理系统,由光学系统、硬字库和一系列压缩技术而组成的计算机混合装置,技术指标:汉字识别字种五万,识别速度1千字/秒,无差错,无拒识。汉字键入平均速度3字/秒。光纤管转印输出速度5千字/秒,分辨率10线/毫米。该装置有与大、中型机联机的国际通用标准接口介面和联机处理软件。也可脱机成批录入,成批输出并有相应处理软件和使用说明书。
本发明所属技术领域:混合计算装置
随着电子技术的发展,大规模集成电路的出现,计算机的容量不断扩大,速度不断提高,功能愈来愈强,信息吞吐量成数量级增长,而外围设备目前还满足不了社会的需要,尤其是汉(文)字输入速度问题一直是国际上的老大难,在国内外专家做了许多研究与开发的基础上,我们吸收了西文字处理的优点,采用了当代新技术(红外,激光,微光摄象,电子技术)与数学原理结合而设计了一种(文)字快速处理系统,该系统分快速识别,快速键入,快速输出三部分。
本发明所参考文献:
〔1〕“我国中文信息处理技术发展概况”
“一种可逆压缩型24×24点陈汉字库的实现”
“计算机研究与发展”杂志1985,第四期
〔2〕曹长久等“实用汉字系统的一次折阅”
计算机应用通讯1982,第3期
〔3〕李金凯“汉字信息和信息字典”
“中文信息处理国际讨论会论文集”
“汉字频度表”
北京新华印刷厂1971年
-快速识别
对大量经印刷出版或打印了的各种书报,刊物,文件等印在纸面上的标准中文信息,随着科学技术的发展,社会的进步,其增长速度是很快的,因此自动地,高速地和准确地将汉字输入计算机是必要的,本快速识别仅对标准印刷体,(字型大小可调)汉字识别。
欧美对文字识别的研究工作始于50年代初期,1955年便出现了印刷体汉字的Optical Character Recognization产品,简称OCR产品,现在,在文字识别研究方面日本已居世界领先地位,对单一印刷体汉字2000字种的识别率至1974年已达到99.9%,对这种传统的识别技术,无论用哪种光电转换方式(飞点扫描法,光电摄象管方式,激光扫描方式,光敏矩阵方式,)都要将纸面上的文字信息变成离散的电信号后送入计算机判别,在计算机内建立标准的辞书,选用适当的识别准则(如相似度准则),距离准则和方法(如图形配比法,结构分析法等)将一未知文字与辞书中所有标准汉字逐个地进行配比,在判别过程中需大量时间,且判别速度随字数的增加明显降低,为提高识别速度又将文字进行分类,(如东芝所用的分类法有复杂指数分类法,四边代码分类法等)将输入的文字首先进行类别判断而后再将未知文字与相应类中的标准文字逐个地进行匹配,再输出图1传统识别逐个匹配方框图(1)汉字原稿,(2)检测,(3)分类,(4)判别。
本发明的目的,建立汉(文)字快速识别技术,快速键入技术,快速输出技术。
本发明的优点:
1、汉(文字快速识别技术中,其判别速度与汉(文)字字数增加无关,未知汉(文)字通过硬软拷贝与全部标准汉(文)字同时并联匹配,而非逐个匹配,因而不需分类,弥补了传统(识别技术)的判别速度随字数不断增加而降低之不足,汉字识别字数可达50000字种,速度可达1000字/秒。
2、建立光学系统,包括光接收部分(微光摄象,光分路技术:光纤型分路,CRT型分路技术)识别准则部分,光处理部分:识别方法,重码处理,输入,输出及其处理软件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于许素兰,未经许素兰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/101985000009039/2.html,转载请声明来源钻瓜专利网。
- 上一篇:挤压绝缘电缆和绝缘液绝缘电缆之间的止动接头
- 下一篇:光缆
- 同类专利
- 专利分类