[发明专利]印刷体文字阅读机无效
申请号: | 97115080.X | 申请日: | 1997-07-31 |
公开(公告)号: | CN1172997A | 公开(公告)日: | 1998-02-11 |
发明(设计)人: | 张博 | 申请(专利权)人: | 张博 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 712000 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 印刷体 文字 阅读机 | ||
本发明系一种用于印刷体文字识别及其语音阅读的装置,是以现代高科技电子技术为主体的一种“光、机、电、声”一体化新型电声设备,完成从文字到声音的转换过程,可以将纸张等介质上的印刷体文字直接以语音方式连续阅读出来,属于模式识别、语音合成和人工智能的技术领域。
目前,印刷体文字的识别技术已经成熟,以简体汉字识别为例,各种市面上的汉字识别软件均能达到下列指标:
①识别字数: 3755~6763 (国标GB-2312汉字库)
②识别率: >98% (中等印刷质量)
③识别速度: >12字/秒 (486/33Hz 4MRAM)
④识别字体: 宋、仿宋、楷、黑及其多体中英文混排
⑤识别字号: 1~6号字 (用高精度扫描仪,可识别7号字)
同时,这些软件还具有较强的抗噪能力,对油印、复印、铅印、针式打印机和各种有磨损的稿件,均有较理想的识别率。
另一方面,语音合成技术也在日趋完善。同样以汉字发音为例,市场上流行的固体电子语音电路已经可以进行声音的记录和再现。另外,汉字虽有六千余个,但其基本读音却只有四百个左右(不含声调),至于同音字,可以在语句上下文中加以判别。因此,要存储所有汉字的语音数据库已不成问题,有些汉字发音系统已经可以用普通话完整、连贯地读出(文字编辑器中的)汉字语句及标点符号,并能准确地区分多音字。
然而,目前还不存在将以上两种技术相结合的产品,即本发明所指的产品,但是这两种技术的结合却十分必要,这是因为:
(1)人类有80%以上的信息由眼睛摄取,在知识爆炸的今天通过印刷传递的文字信息给人的眼睛带来了日益沉重的压力,而这种结合则充分地发挥人耳的感知能力。
(2)这种结合有理利于人类尤其是青少年的视力保护。众所周知,青少年今天所面临的学习负担日益加重,严重地危害着他们的视力健康。
(3)还可以使人们在没有光线的条件下继续获取文字信息。
(4)还可以为盲人获取书本知识提供帮助,甚至可以替代盲人以盲文传递和获取信息的方式。
本发明正是基于以上考虑,目的在于发掘人耳获取文字信息的感知能力,减轻人眼放的使用负担。
各种语言文字都有特定的结构和读音规则,但汉字“方块结构”和“单字单音(不存在拼读问题)”的特点在印刷体文字识读方面却有着其独特的优势。因此,本发明主要针对汉字提供实施方案(下文中的文字特指汉字)。当然,其他语言的识读可以以汉字识读装置的构造原理依此类推,只是因存在拼读等问题,而略显得复杂些。随着科技的不断进步,它们的实现将不成问题。
一个印刷文字的识读装置的原理结构如图1所示,它由扫描输入设备(1)和主机设备(2)两大部分组成,前者将印刷体文字由光信号转换为电信号,后者则对这些电信号进行处理、识别和诵读。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张博,未经张博许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/97115080.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:铁路轨道及其铺设方法
- 下一篇:减少热挤型材生产损失的铝锭热剪装置和方法