[发明专利]以词为单位的音形意汉字编码及中西文兼容键盘在审
申请号: | 94102574.8 | 申请日: | 1994-03-14 |
公开(公告)号: | CN1108774A | 公开(公告)日: | 1995-09-20 |
发明(设计)人: | 刘向东 | 申请(专利权)人: | 刘向东 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 北京科龙专利事务所 | 代理人: | 张民社 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 单位 形意 汉字编码 西文 兼容 键盘 | ||
1、以词为单位的音形意汉字编码及中西文兼容键盘,其特征在于:
(一)中西文兼容键盘
a、该键盘共有56个键位,其中有3个键位为状态键位,40个键位为基本键位,13个键位为辅助键位,换档键(共2个)、命令键为状态键位;11-10、21-20、31-30、41-40共40个键位为基本键位;
(1)-(13)共13个键位为辅助键位;
b、中文键盘根据“换档”、“命令”两种状态组合为下列4种状态:
c、中文状态Ⅰ的各键位定义
该状态下21-20、31-30、41-40的30个键位定义为拼音码键位,即汉语拼音的声母或者汉语拼音的韵母字母:
键位 键名 对应拼音码 类型
21 欺 q 声母
22 乌 w 声母
23 鹅 e 声母
24 日 r 声母或韵母字母
25 特 t 声母
26 衣 y 声母
27 乌 u 韵母字母
28 衣 i 韵母字母
29 喔 o 韵母字母
20 坡 p 声母
31 啊 a 韵母字母
32 诗声母
33 得 d 声母
34 佛 f 声母
35 哥 g 声母
36 喝 h 声母
37 基 j 声母
38 科 k 声母
39 勒 l 声母
30 思 s 声母
41 知声母
42 希 x 声母
43声母
44 迂韵母字母
45 玻 b 声母
46 讷 n 声母或韵母字母
47 摸 m 声母
48 雌 c 声母
49韵母字母
40 资 z 声母
该状态下11-10的10个键位定义为汉字部首码键位:
键位 键名 部首码 对应部首
11 横 1 一示礻(示)髟
12 垂 2 |丿彡攴采
13 点 3 丶冫氵灬水()
14 十 4 十
15 手 5 手扌
16 口 6 口
17 折 7 乙()巛彐()
18 八 8 八()人(入)亻彳
19 小 9 小()忄()
10 亠 0 亠衣衤言讠(言)
该状态下1-13的13个键位定义为辅助键位:
键位 键名 定义
(1) 并连写短横 《汉语拼音正词法基本规则》中的半连写短横“一”
(2) 下页 用于选择重码:提示行下翻一页
(3) 上页 用于选择重码:提示行上翻一页
(4) 修改 即一般西文键盘中的BACKSPACE键
(5) 制表 即一般西文键盘中的TAB
(6) 下一 用于选择重码:提示行中光标向右移一词
(7) 上一 用于选择重码:提示行中光标向左移一词;
(8) 在写锁定 按下该键后,中文状态Ⅰ的30个拼音码键位全部
被锁定为中文状态Ⅱ的30个汉字部首码键位, 再按一次恢复原状态,该键位对中文状态Ⅰ的30 个拼音码键位以外的任何中文键位不起作用
(9) 学习 笔形码万能替换键
(10) 略语 传统词的词尾标记
(11) 隔音符号 隔音符号“′”
(12) 词尾 标准词的词尾标记
(13) 隔音符号 与(11)键位完全相同
d 中文状态Ⅱ的各键位定义
该状态下11-10的10个键位定义为中文数字键位:
键位 11 12 13 14 15 16 17 18 19 10
键名 一 二 三 四 五 六 七 八 九 ○
定义 一 二 三 四 五 六 七 八 九 ○
该状态下21-20、31-30、41-40的30个键位定义为汉字部首键位:
键位 键名 部首码 对应部首
21 犬 Q 犬 犭 气 欠 其 青
22 王 W 王 文 攵 夂 韦()瓦 毋(母)
23 二 E 二 儿 耳卩()阝(在左)阝(在右)
24 日 R 日 曰(曰)
25 土 T 土 士 田 冖
26 又 Y 又(ヌ)尢 弋 月(月) 业 用 疋()
幺 页(頁)羊() 酉 音
27 纟 U 纟()糸 廴 丬(爿)
28 疒 I 疒 宀
29 囗 O 囗 冂 匚 凵
20 片 P 片 皮
31 艹 A 艹 廾(在下)
32 食食 饣(食) 山 石 尸 身 豕 鼠 矢
舌 殳
33 刀 D 刀()刂 大 豆 歹 斗
34 父 F 父 风(風) 方 缶
35 工 G 工 广 弓 戈 艮()瓜 革 骨 鬼
36 火 H 火 户 禾 黑 虍
37 金 J 金 钅 (金)几(几) 已(巳)巾 见(見)
斤 臼 角
38 k K (不对应任何部首)
39 力 L 力 立 里 龙(龍)耒 老 卤(鹵) 鹿
30 厶 S 厶 四
41 竹竹()爪(爫) 舟 止 豸 隹
42 心 X 心 血 西(覀) 夕 穴 辛
43 厂厂 车(車)臣虫 赤 辰 齿(齒)
44 鱼 ü 鱼(魚)雨()羽 肀 (聿)
45 卜 B 卜() 比 贝(貝) 白 鼻
46 女 N 女 牛(牜)鸟()
47 木 C 木 马(馬)米 麦()麻毛目门(鬥)
矛 皿 黾()
48 寸 C 寸
49 勹 勹
40 走 Z 走 辶()子(孑)自 足()
该状态下(1)-(13)的13个辅助键位与中文状态Ⅰ完全相同;
e、中文状态Ⅲ的各键位定义
该状态下11-15、21-25、31-35、41-45的20个键位无定义;
该状态下16-10、26-20、36-30、46-40的20个键位定义为中文标点符号键位:
键位 键名 标点符号 说明
16 连接号Ⅰ -
17 破折号 -- (占两个中文字符位置)
18 省略号 …… (占两个中文字符位置)
19 左方括号 [
10 右方括号 ]
26 间隔号 ·
27 顿号 、
28 问号 ?
29 左圆括号 (
20 右圆括号 )
36 冒号 :
37 逗号 ,
38 句号Ⅰ 。
39 左双引号 “
30 右双引号 ”
46 专名号 -
47 分号 ;
48 叹号 !
49 左双书名号 《
40 右双书名号 》
该状态下(1)--(13)的13个辅助键位中(10)和(12)两个键位定义如下:
键位 键名 定义
(10) 回车 即一般西文键盘中的RETURN键(或ENTER键)
(12) 西文 中文状态下一旦击该键即进入西文状态。
其他11个辅助键位定义与中文状态Ⅰ下完全相同;
f、中文状态Ⅳ的各键位定义
该状态下16、19、10、26、29、30、38、39、30、46、49、40共12个键位被定义为中文标点符号键位
键位 键名 标点符号
16 连接号Ⅱ ~
19 左方头括号 【
10 右方头括号 】
26 着重号 ·
29 左六角括号 〔
20 右六角括号 〕
38 句号Ⅱ 。
39 左单引号 ‘
30 右单引号 ’
46 浪线 ~~~
49 左单书名号 <
40 右单书名号 >
该状态下17、18、27、28、36、37、47、48的八个键位无定义,其它所有键位与中文状态Ⅲ完全相同;
(二)、汉字编码
b、拼音码,部首码,字身,无字身的汉字,有字身的汉字,字身码,笔形码,单个汉字的编码
b、1拼音码,是由拼音同时经过下述两种标准代换得来的:
(a)拼音中的所有声调符号在拼音码中全部省去;
(b)拼音中的声母zh(知)、ch(蚩)、sh(诗)在拼音码中全部以、来代替,拼音中的韵母ang(昂)、iang(央)、uang(汪)、eng(亨的韵母)、ing(英)、ueng(翁)、ong(轰的韵母)、iong(雍)在拼音码中全部以a、ia、ua、e、i、ue、o、io来代替;
b、2部首码,是由部首变化而来的;每一个部首均对应一个部首码,其对应关系见本说明书中西文兼容键盘部分中文状态Ⅰ及中文状态Ⅱ下的汉字部首码键位定义表;
b、3字身,是相对于部首而言的;汉字除去部首之外的部分,就是该汉字的字身;
b、4无字身的汉字是指以下179个汉字:
一、乙、二、十、厂、卜、八、人、入、儿、几、厶、又、刀、力、爿、广、门、(門)、工、土、士、大、(尢)、寸、弋、小、口、○、巾、山、彳、夕、尸、己、已、(巳)、(巳)、弓、女、幺、乡、子、孓、孑、马、(馬)、斗、文、方、火、(火)、心、户、王、韦、()、木、犬、歹、车、(車)、戈、比、瓦、止、日、曰、贝、(貝)、见、(见)、(見)、父、牛、手、毛、气、片、斤、爪、月、欠、风、風、殳、聿、毋、毌、母、水、穴、立、示、石、龙、(龍)、业、目、田、甲、申、由、电、四、皿、矢、禾、白、瓜、鸟、、用、甩、矛、疋、(疋)、皮、衣、羊、米、耒、老、考、耳、臣、页、(頁)、虫、缶、舌、竹、臼、自、血、舟、羽、艮、辛、言、麦、()、走、赤、豆、酉、辰、豕、卤、(鹵)、里、足、豸、谷、身、角、青、其、雨、齿、(齒)、黾、()、金、隹、鱼、(魚)、音、革、骨、食、鬼、(門)、麻、鹿、黑、鼠、鼻;
b、5有字身的汉字,是相对于无字身的汉字而言的;一个汉字不是无字身的汉字,就一定是一个有字身的汉字
b、6字身码,是由有字身的汉字的定义派生出来的;有字身的汉字一定有字身码;反之,无字身的汉字一定没有字身码;一个有字身的汉字(为叙述方便起见以下称之为汉字α,下同)的字身码的码长为一至三码,取码规则如下:
b、6、1使用者知道汉字α的字身本身能够成为一个通用汉字β;
b、6、1、1汉字β是一个无字身的汉字,则汉字α的字身码有且仅有一码,即汉字β的部首码;
b、6、1、2汉字β是一个有字身的汉字;
b、6、1、2、1汉字β的字身码有且仅有一码,则汉字α的字在码有且仅有两码,第一码为汉字β的部首码,第二码为汉字β的字身码;
b、6、1、2、2汉字的β的字身码有两码或两码以上,则汉字α的字身码有且仅有三码,第一码为汉字β的部首码,第二码为汉字β的字身码的第一码,第三码为汉字β的字身码的第二码;
b、6、2使用者并不知道汉字α的字身能否成为一个通用汉字;
b、6、2、1汉字α的字身是由三个或三个以上不相交的部首构成的,则汉字α的字身码有且仅有三码;按照汉字α的书写顺序依次取前三个部首,取每个部首的部首码依次构成汉字α的字身码的第一码、第二码、第三码;
b、6、2、2汉字α的字身是由两个不相交的部首构成的,则汉字α的字身码有且仅有两码;按照汉字α的书写顺序取第一个部首的部首码作为汉字α的字身码的第一码,取第二个部首的部首码作为汉字α的字身码的第二码;
b、6、2、3汉字α的字身本身为且仅为一个部首,则汉字α的字身码有且仅有一码,即该部首的部首码;
b、6、2、4其他情况;
b、6、2、4、1汉字α的字身是由三个或三个以上既不相连又不相交的部分构成的,则汉字α的字身码有且仅有三码;按照汉字α的书写顺序依次取它的字身的前三部分,每部分按下述规则取一码,依次构成汉字α的字身码的第一码、第二码、第三码:(a)该部分本身为且仅为一个部首时,该部首的部首码即为该部分的代码,(b)其他任何情况取K为该部分的代码;
b、6、2、4、2汉字α的字身是由两个既不相连、又不相交的部分构成的,则汉字α的字身码有且仅有两码;按照汉字α的书写顺序依次取这两部分,每部分按下述规则取一码,依次构成汉字α的字身码的第一码、第二码:(a)该部分本身为且仅为一个部首时,该部首的部首码即为该部分的代码,(b)其他任何情况取K为该部分的代码;
b、6、2、4、3其他任何情况,汉字α的字身码有且仅有一码,即K;
b、7笔形码的定义如下:无字身的汉字的笔形码,就是该汉字的部首码;有字身的汉字的笔形码,由其部首码+其字身码构成;
b、8单个汉字的编码定义如下:
b、8、1使用者知道该汉字的标准汉语拼音;
b、8、1、1该汉字符合“言文一致”的原则;
b、8、1、1、1中文数字“一”、“二”、“三”、“四”、“五”、“六”、“七”、“八”、“九”、“○”的10个汉字的编码为其自身;
b、8、1、1、2其他汉字的编码由其拼音码+笔形码构成;
b、8、1、2该汉字不符合“言文一致”的原则,则该汉字的编码由其笔形码构成;
b、8、2使用者并不知道该汉字的标准汉语拼音,则该汉字的编码由其笔形码构成;
c、词,词的分类(标准词、传统词、其他词),单字词,双字词,多字词,隔音符号,加隔音符号的规则,词的编码;
c、1词的定义如下:
单个汉字或者符合下列条件的连在一起的N个汉字(N为大于或等于2的正整数),只要使用者认为是一个词,就被定义为一个词:(a)N=2时(即该词是由2个汉字构成的),则第一个汉字和第二个汉字紧密相连,中间不存在其他任何文符号(如中文标点符号、西文字符等等);(b)N≥3时(即该词是由3个或3个以上的汉字构成的),任取一个大于1并且小于N的正整数m(即1<m<N)则,第m-1个汉字和第m个汉字、第m个汉字和第m+1个汉字全都紧密相连,它们中间都不存在其他任何文字符号(如中文标点符号、西文字符等等)
c、8加隔音符号的规则如下:
c、8、1单字词的编码中不加隔音符号
c、8、2双字词或多字词的首字的编码之前不加隔音符号
c、8、3双字词或多字词的除首字外的其他任何一个汉字,只要符合下列条件之一的,就必须在该字的编码前加隔音符号:
c、8、3、1使用者并不知道该字的拼音,或者虽然知道该字的拼音,但该字不符合“言文一致”的原则;
c、8、3、2使用者知道该字的拼音,而且该字符合“言文一致”的原则,同时,使用者还知道该字前的那个汉字的拼音,而且该字前的那个汉字也符合“言文一致”的原则,并且:(a)该字的编码的第一码为a,且该字前面的那个汉字的编码的最后一码为b、c、、d、f、g、h、i、k、l、m、n、p、r、s、、t、u、、w、y、z、之中的任何一个;(b)或者该字的编码的第一码为e,且该字前面的那个汉字的编码的最后一码为b、c、、d、f、g、h、i、k、l、m、n、p、r、s、、t、u、ü、w、y、z、之中的任何一个;(c)或者该字的编码的第一码为o,且该字前面的那个汉字的编码的最后一码为a、b、c、、d、f、g、h、i、k、l、m、n、p、r、s、、t、u、w、y、z、之中的任何一个;(d)或者该字的编码的第一码为n,且该字前面的那个汉字的编码的最后一码为a、e、i、u、ü之中的任何一个;(e)或者该字的编码的每一码为r,且该字前面的那个汉字的编码的最后一码为e
c、8、4其他任何情况,可以不加隔音符号
c、9词的编码
c、9、1使用者知道该词是一个标准词
c、9、1、1单字词“的”、“地”、“得”的编码分别为d+词尾、di+词尾、de+词尾;
c、9、1、2其他单字词的编码由构成该单字词的那个单个汉字的编码+词尾构成;
c、9、1、3双字词或多字词;
c、9、1、3、1组成该词的最后一个单个汉字为注音作r的后缀“儿”,则该词的编码由该词的最后一个汉字外的各单个汉字的编码+r+词尾构成。其中按照加隔音符号的规则应该加隔音符号的单个汉字还必须在其编码前加隔音符号,此处还特别指出,后缀“儿”前面的那个汉字的编码的最后一码为e时,也必须在“儿”的编码(即r)前加隔音符号;
c、9、1、3、2其他情况下该词的编码由构成该词的各单个汉字的编码+词尾构成;其中按照加隔音符号的规则应该加隔音符号的单个汉字还必须在其编码前加隔音符号;
c、9、2使用者并不知道该词是否是一个标准词,但知道该词是一个传统词;
c、9、2、1该词是一个单字词,则该词的编码由构成该单字词的那个单个汉字的编码+略语构成;
c、9、2、2双字词或多字词
c、9、2、2、1组成该词的最后一个单个汉字为注音作r的后缀“儿”,则该词的编码由该词的最后一个汉字以外的各单个汉字的编码+r+略语构成;其中按照加隔音符号的规则应该加隔音符号的单个汉字还必须在其编码前加隔音符号,此处还特别指出,后缀“儿”前面的那个汉字的编码的最后一码为e时,也必须在“儿”的编码(即r)前加隔音符号;
c、9、2、2、2其他情况下该词的编码由构成该词的各单个汉字的编码+略语构成;其中按照加隔音符号的规则应该加隔音符号的单个汉字还必须在其编码前加隔音符号
c、9、3其他任何情况,必须把这个词全部拆为单个汉字,每个单个汉字都作为一个单字词进行输入,每个单字词的编码为该汉字的编码+词尾构成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘向东,未经刘向东许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/94102574.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种特制广告纪念表
- 下一篇:一种天然杨桃汁饮料及其加工方法