[发明专利]一种字母与数字组合编码的检验位方法在审
申请号: | 201710856288.6 | 申请日: | 2017-09-21 |
公开(公告)号: | CN107577652A | 公开(公告)日: | 2018-01-12 |
发明(设计)人: | 房敏;成福春;朱亮;刘华;冯佳;周蜜果 | 申请(专利权)人: | 上海中医药大学附属岳阳中西医结合医院 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 上海卓阳知识产权代理事务所(普通合伙)31262 | 代理人: | 周春洪 |
地址: | 200437 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字母 数字 组合 编码 检验 方法 | ||
技术领域
本发明涉及检验位编码技术领域,具体地说,是一种字母与数字组合编码的检验位方法。
背景技术
医学术语的编码化,对于规范临床数据采集,数据检索分析利用,提升信息系统处理的效率与准确性,提升医疗质量以及研究的深度,均具有重要意义。
J Verhoeff基于对手工录入数字编码时发生的12000个错误的研究,将人们常犯的错误进行总结,共分为7类。⑴单个错误,a变成b,在所有错误中约占60%~95%。⑵遗漏或增加1个数字,占所有错误的10%~20%。⑶换位错误,ab变成ba,占所有错误的10%~20%。⑷双子错误,如aa变成bb,占所有错误的0.5%~1.5%。⑸跳跃转换,如acb变成bca,占所有错误的0.5%~1.5%。⑹跳跃双子错误,如aca变成bcb,发生率<1%。⑺发音错误,如1a与a0,英文的13与30、14与40、15与50等,发生率约0.5%。可以看出,人们在处理数字错误时,常犯的错误以一位为主。因此,考虑增加校验位,针对一位错误,设计相应的算法,成为检验位方法研究的主要内容。
常用的编码,有纯数字的,也有字母与数字组合的。而在日常应用中,以字母与数字组合的编码更为常见。常见的是以26个英文大写字母、10个阿拉伯数字为基本元素,总共36个字符,进行相应的编码。一般的编码,没有增加相应的校验位,无法判断出编码本身的错误。
因此,设计出一种基于字母与数字组合的医学术语编码体系,具有十分重要的现实意义。
在日常应用中,通过相应的算法,给编码增加校验位,以判断编码本身是否有错误。常见检验位方法有以下几种:
1按位累加取模
常见的模(除数)为7、9、11、13等质数,因其每一位余数均与该模互质。按位累加取模,赋予校验位。在验证时,按同样算法进行比较,相等说明编码正确,不等则编码有误。优点是算法简单,可以校验出大部分一位错误。缺点是累加取模,无位置信息,不能判断出相邻换位错误,如ab变成ba。当模的数字<10时,会出现相关重复错误情况,导致不能检测出所有单个错误,如取模为7的7与0、8与1、9与2,取模为9的9与0等。
2多项式乘法检验位方法
原理为K元组的点乘和取余,即(a1,a2……ak)·(w1,w2……wk)mod m=(a1w1+a2w2+……akwk)modm=0。常见的模m为10或11。
2.1取模m为10UPC编码(universal productcode)是最早大规模应用的条码,为长度固定、连续性的条码,主要在美国和加拿大使用,由于其应用范围广泛,故又被称为万用条码。UPC编码仅可用来表示数字,故其字码集为数字0~9。在UPC编码中,a1、a2……a12满足以下等式:(a1,a2,……,a12)·(3,1,3,1……3,1)mod 10=0,a12为校验位值。
优点是可以检测出所有的单个错误,也可以检测出ab变成ba这种相邻位置换位错误。缺点是不能检测出abc变成cba这种错误,也不能检测出|a-b|=5的交换错误。
2.2取模m为11模为11时,余数为0,1,2,3,4,5,6,7,8,9,10。当余数为10时,为了不增加位数,往往用X来代替。如国际图书编码ISBN号0-669-19493,校验位X,代表10,校验位a10满足(a1,a2,……,a9,a10)·(10,9,8,7,6,5,4,3,2,1)mod 11=0。优点是可以检测出所有一位错误及相邻位置换位错误。缺点是增加了字母X,使编码不再是纯数字,在信息系统定义数据类型方面存在不便。由于在计算机表示中,数字的表示与字母的表示存在着差别,将两者合在一起来表示某一特定的编码,无疑增加了算法处理的复杂性,增加了系统设计及改造的成本,增加了系统处理的难度以及社会使用成本。
综上所述,需要一种字母与数字组合编码的检验位方法。基于D18二面体群算法,给字母与数字组合的编码增加一位校验位,实现中医术语字母与数字组合的编码,该编码可以校验出所有的一位错误,以及所有相邻两位交换错误,且被猜中的比率,与纯数字相比,从1/10降为1/36,大大增加了系统编码本身的安全性,使得基于编码的中医术语可应用于各个信息系统之中,以及系统与系统之间的数据交换之中,从而提高数据传输的准确性,最终提高数据的质量。而关于这种检验位算法目前还未见报道。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海中医药大学附属岳阳中西医结合医院,未经上海中医药大学附属岳阳中西医结合医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710856288.6/2.html,转载请声明来源钻瓜专利网。