[发明专利]对于包含非编码字符的查询使用统一资源定位符来增强搜索结果相关性排序有效
申请号: | 201110252294.3 | 申请日: | 2011-08-30 |
公开(公告)号: | CN102385609A | 公开(公告)日: | 2012-03-21 |
发明(设计)人: | 宋睿华;Q.姚;陈俊燕 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 刘红;刘鹏 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 计算机可读媒体、计算机系统以及计算设备有助于利用统一资源定位符(URL)/非编码字符(NEC)字对来增强网页索引,以便于响应于包括NEC字的搜索查询而提供的搜索结果的相关性排序。URL从网页中接收,并从URL中提取子串。附加的元素从网页中接收、被断字成NEC字序列并被转换成编码语言表示,其中编码语言表示相对于URL子串进行匹配,以标识候选URL/NEC对,以便在相关性排序中使用。 | ||
搜索关键词: | 对于 包含 编码 字符 查询 使用 统一 资源 定位 增强 搜索 结果 相关性 排序 | ||
【主权项】:
一种或多种计算机可读媒体,其中在所述计算机可读媒体上已包括有计算机可执行指令,所述计算机可执行指令当由与搜索服务相关联的计算设备中的处理器执行时使得所述计算设备执行利用统一资源定位符(URL)/非编码字符(NEC)字对来增强网页索引的方法,以便于响应于包括NEC字的搜索查询而提供的搜索结果的相关性排序,所述方法包括:接收(1010)与网页相对应的统一资源定位符(URL),其中所述URL包括编码字符的第一字符串;将编码字符的第一字符串变换(1020)成一个或多个NEC字,其中所述变换包括基于来自所述网页的内容来推断出变换;以及将NEC字的集合包括(1030)在网页索引中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110252294.3/,转载请声明来源钻瓜专利网。