[发明专利]文本样本条目组制定有效
申请号: | 201480059862.X | 申请日: | 2014-10-27 |
公开(公告)号: | CN105683958B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | C·佩特克勒斯克;M·杜米特鲁;V·帕拉斯基夫;A·耐茨;P·J·桑德斯 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/31;G06F16/33 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 顾嘉运 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 以可以快速搜索文本样本的方式存储文本样本。文本样本被分配文本样本标识符并且各自被解析以由此从文本样本中提取文本分量。具有相同内容的文本分量被分配相同的文本分量标识符。对于所解析的每一文本分量,创建文本分量条目,该文本分量条目包括所分配的文本分量标识符以及从中解析出该文本分量的文本样本的文本样本标识符。为每一文本样本创建文本样本条目组,该文本样本条目组按序包含对应于文本样本内发现的文本分量的文本分量条目。存储文本样本条目组以使得可以在将来搜索期间扫描。 | ||
搜索关键词: | 文本 样本 条目 制定 | ||
【主权项】:
一种方法,包括:访问文本样本的集合的动作,每一文本样本具有对应的文本样本标识符;对于文本样本的所述集合中的至少某些文本样本中的每一个文本样本,使该文本样本就绪的动作,所述使该文本样本就绪的动作包括:从所述文本样本中解析多个文本分量的动作;以及对于所解析的多个文本分量中的至少某些文本分量中的每一个文本分量,标识该文本分量的动作,所述标识该文本分量的动作包括:确定所述文本分量的内容是否已经被相关到文本分量标识符的动作;如果所述文本分量的内容已经被相关到文本分量标识符,则将所述文本分量标识符分配给所述文本分量;如果所述文本分量的内容尚未被相关到文本分量标识符,则将新文本分量标识符分配给所述文本分量;以及创建文本分量条目的动作,所述文本分量条目包括a)从中解析出所述文本分量的文本样本的文本样本标识符,以及b)所分配的文本分量标识符;以及创建文本样本条目组的动作,所述文本样本条目组包括对应于从所述文本样本中解析出的文本分量的多个文本分量条目,并且使得所述多个文本分量条目按对应的文本分量在所述文本样本内的顺序来排序;存储通过对文本样本的所述集合中的至少某些文本样本中的每一个文本样本执行所述使该文本样本就绪的动作来创建的多个文本样本条目组的动作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201480059862.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种灵活调节的穿戴式电子设备
- 下一篇:一种车联网监控系统