[发明专利]获得文本的表示的方法无效
申请号: | 200680042744.3 | 申请日: | 2006-11-03 |
公开(公告)号: | CN101310277A | 公开(公告)日: | 2008-11-19 |
发明(设计)人: | J·H·M·科斯特;G·格莱恩斯 | 申请(专利权)人: | 皇家飞利浦电子股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 李静岚;谭祐祥 |
地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获得 文本 表示 方法 | ||
1.获得包括文本的表示的数据文件(20;22)的方法,包括:
根据提交给服务器系统(5)的搜索查询而获得包含字符串的多个候选文件(13;25),其中该服务器系统(5)被安排成允许执行对至少一个服务器(1-3)的内容的搜索,
通过以下方式而形成该多个候选文件的子组(19;35),
(A)选择至少一个初始候选文件,用于包括在基本组(31)中,
(B)对于该多个候选文件的进一步的复数个候选文件的每一个,确定基于至少某些字符串的数据与基于至少某些仅在以前被选择来包括在基本组(31)的候选文件中的字符串的数据相比较,是否满足相似性测度,以及
(C)在确定该相似性测度被满足后,把该候选文件加到基本组(31),以及
仅仅从该子组(19;35)中的至少一个候选文件形成文本的表示。
2.按照权利要求1的方法,包括:
其中在步骤(B)中从该多个候选文件(13;25)的每一个中提取一定数目的不同字符串,以对于该多个候选文件(13;25)的每一个形成一个字符串表征组,且
将多个字符串表征组与该字符串表征组的至少另外一个相比较,以及
其中在步骤(C)中将那些其字符串表征组共同具有大于一定数目的字符串的候选文件加到所述子组(19;35)。
3.按照权利要求2的方法,其中从多个候选文件(13;25)的每一个中提取一定数目的不同字符串的步骤包括:把在多个候选文件(13;25)的每一个的至少一部分中的不同字符串按照它们的长度进行分类,以及从最长的字符串中间选择该一定数目的不同字符串。
4.按照权利要求3的方法,包括按照另一个规则从具有相等长度的不同字符串中间选择字符串。
5.按照权利要求2的方法,其中从候选文件中提取一定数目的不同字符串的步骤(14;28)包括:
确定至少所选择的不同字符串在候选文件中的出现频率,以及
由所选择的不同字符串中的至少在选定频率范围内具有最高出现频率的那些字符串来形成表征组。
6.按照权利要求1-5的任一项的方法,包括:
通过以下步骤获得附加候选文件(37)
根据对于其而言、基于至少某些字符串的数据满足相似性测度的多个候选文件所共有的至少一个字符串来制定搜索查询,以及
把制定的搜索查询提交到被安排成允许搜索至少一个服务器(1-3)的内容的服务器系统(5)。
7.按照权利要求1-5的任一项的方法,其中所述多个候选文件(13;25)是根据被提交到服务器系统(5)的搜索查询而获得的,该服务器系统(5)被安排成下载被存储在至少一个服务器(1-3)上的数据、维护所下载的数据的高速缓存、形成被高速缓存的内容的索引、和比较该搜索查询与该索引,其中该多个候选文件(13;25)是根据从由服务器系统(5)维护的高速缓存中检索的数据而获得的。
8.按照权利要求1的方法,其中如果对于该多个候选文件的进一步的复数个候选文件的每一个,已确定基于至少某些字符串的数据是否满足相似性测度,以及基本组(31)包括少于一定数目的成员,则通过选择至少一个初始候选文件来包括在另一个基本组(31)中而形成另一个基本组(31),每个被选择的初始候选文件不同于被选择来包括在任何以前形成的基本组中的初始候选文件,以及重复进行步骤(A)-(C),以完成该另一个基本组。
9.按照权利要求8的方法,包括:在形成多个基本组(31)和确定每个组包括少于一定数目的成员后,选择具有最多成员的基本组作为子组(35),从该子组的候选文件中形成文本的表示。
10.按照权利要求1-5的任一项的方法,包括:
使用选择准则,从多个候选文件(13;25)的每一个中提取一定数目的不同字符串,以对于该多个候选文件的每一个形成一个字符串表征组,
按照通过选择准则确定的字符串的至少一个的重要性来排列字符串表征组,选择其表征组在对于以前被选择作为初始候选文件的任何候选文件的表征组之下在排列中呈现为最高的文件,作为初始候选文件的至少之一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦电子股份有限公司,未经皇家飞利浦电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680042744.3/1.html,转载请声明来源钻瓜专利网。