[发明专利]比较有界域的值有效
申请号: | 201110056942.8 | 申请日: | 2011-03-02 |
公开(公告)号: | CN102193967A | 公开(公告)日: | 2011-09-21 |
发明(设计)人: | G·迪金森 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 顾嘉运 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 比较 界域 | ||
1.一种计算机实现的方法,包括:
对于有界域中的每一个值(201),确定(402)与所述值(201)相关联的对应的容许差错集(202);
将所述容许差错集存储(404)在存储器处;以及
基于对应于所述有界域中的第一值(321)的第一容许误差集与对应于所述有界域中的第二值(322)的第二容许误差集的比较来确定(406)所述第一值(321)和所述第二值(322)之间的比较分数(331)。
2.如权利要求1所述的计算机实现的方法,其特征在于,所述对应的容许差错集包括印刷差错、范围差错、换位差错、转写差错或其任何组合,并且其中所述有界域是有限数字域、日期域、有限色谱域、列表域、和枚举集合域中的一个。
3.如权利要求1所述的计算机实现的方法,其特征在于,特定容许差错集中的每一个容许差错在所述有界域内,并且其中存储特定容许差错集包括将表示特定集合的位掩码存储在所述存储器处。
4.如权利要求3所述的计算机实现的方法,其特征在于,所述位掩码由32位无符号整数、64位无符号整数、128位无符号整数和全局唯一标识符(GUID)中的一个来表示。
5.如权利要求3所述的计算机实现的方法,其特征在于,存储所述特定容许差错集还包括将所述位掩码中的逻辑真位的计数存储在所述存储器处。
6.如权利要求5所述的计算机实现的方法,其特征在于,确定所述比较分数包括:
从所述存储器中检索对应于所述第一值的第一位掩码和第一计数;
从所述存储器中检索对应于所述第二值的第二位掩码和第二计数;
基于所述第一位掩码和所述第二位掩码来确定相似性分数。
7.如权利要求6所述的计算机实现的方法,其特征在于,基于所述第一位掩码和所述第二位掩码来确定所述相似性分数包括:
计算所述第一位掩码和所述第二位掩码的逻辑交集;
确定表示所述逻辑交集中的逻辑真位的数量的第三计数;
计算所述第一位掩码和所述第二位掩码的逻辑并集;
确定表示所述逻辑并集中的逻辑真位的数量的第四计数;以及
计算所述第三计数和所述第四计数的商。
8.如权利要求7所述的计算机实现的方法,其特征在于,确定所述第四计数包括从所述第一计数与所述第二计数的和中减去所述第三计数。
9.如权利要求1所述的计算机实现的方法,其特征在于,所述存储器包括计算机系统处的随机存取存储器(RAM)、计算机系统处的基于盘的存储或其任何组合,并且其中所述比较分数在所述计算机系统的运行时期间确定,并且其中所述容许差错集在所述计算机系统的运行时之前存储。
10.如权利要求1所述的计算机实现的方法,其特征在于,所述容许差错集被存储为软件程序处的常量和不可变数据中的一个。
11.如权利要求1所述的计算机实现的方法,其特征在于,还包括将所述有界域中的特定值分成多个n元语法并且为所述多个n元语法中的每一个确定对应的容许差错集。
12.如权利要求1所述的计算机实现的方法,其特征在于,所述容许差错集在相对于所述有界域的大小的线性时间内计算,并且其中所述比较分数在相对于所述有界域的大小的恒定时间内计算。
13.如权利要求1所述的计算机实现的方法,其特征在于,还包括:
当所述比较分数小于相似性阈值时,输出所述第一值和所述第二值不相似的指示;以及
当所述比较分数大于或等于所述相似性阈值时,输出所述第一值和所述第二值相似的指示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110056942.8/1.html,转载请声明来源钻瓜专利网。