[发明专利]一种页面地域权重模型实现方法有效
申请号: | 201310260778.1 | 申请日: | 2013-06-27 |
公开(公告)号: | CN103631839B | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | 张克非;刘志勤;蒲伟;郭焰莲;李江;张胜标;黄超 | 申请(专利权)人: | 西南科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 621010 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 页面 地域 权重 模型 实现 方法 | ||
技术领域
本发明涉及一种页面地域权重模型实现方法,尤其涉及一种引擎搜索结果排序,以及用户对应区域位置信息的精确检索问题的实现方法。属于引擎搜索及信息检索领域。
背景技术
随着互联网时代不断推进,网络已经成为巨大的知识宝库,据统计,截止到2011年12月底,中国网站数量为230万。同时,中国网页数量达到866亿个。而对于目前针对搜索指定地域信息的准确度很差,造成搜索结果冗余以及无关网页过多。迫切需要一种针对特定地域信息权重的生成方法使得搜索结果更加准确与人性化。
根据大量搜索经验显示,对本土化信息关注度是村(镇,县(区),市,省)、相邻村(镇,县(区),市,省)以及高级别的信息(镇,县(区),市,省),基于此原理,迫切需要页面搜索技术能准确、完善地实现信息本土化检索。
当前搜索引擎大多都利用关键词匹配技术作为计算页面权重的重要影响因素之一。实际应用过程中由于没有地域针对性和可变化性,因此存在三问题:
(1)地域信息搜索结果繁杂冗余;
(2)特定地域信息检索的准确率低;
(3)搜索结果没有针对用户习惯的特定地域信息个性化排序。
而现有的提供地域化信息搜索类的方法和系统:如CNKI上公开号为 CN101651634公开了一种提供地域化信息的方法和系统,其构成方法是萃取文档数据中的地理信息;根据萃取的地理信息在预置的地理信息库查找对应的地理属性,并为所述文档数据标记所述查找到的地理属性;获取用户的地理属性;将标记的地理属性与用户的地理属性匹配的文档数据提供给用户。虽然利用本发明,可以提供适于用户的地域化信息,但其不足之处是由于其只是简单匹配地理信息,而没有关注地域信息周边以及高级别的信息,检索范围过窄。没有较为完善实现信息本土化。
发明内容
本发明的目的在于解决上述问题而提供的一种页面地域权重模型实现方法,这种页面地域权重模型实现方法能够从大量的、冗杂、多样的网页页面中快速、准确的检索出针对特定地域信息权重计算生成的本土化、个性化的信息,同时有效解决了现有地域信息搜索技术的搜索结果繁杂冗余、准确率低、没有针对用户习惯的特定地域信息个性化排序的缺点。
为了达到上述目的,本发明采用了以下技术方案:
本发明所述一种页面地域权重模型实现方法,根据行政区划分的原理,建立基于行政区域划分的地理信息库以及同级别地理相邻位置关系图,以用户查询地域信息以及权重值队列为输入,动态输出用户查询地域以及相关地域信息权重队列,并用修正算法对动态输出的地理信息权重队列进行修正,输出修正后的地理信息权重队列。检索程序利用输出的地域权重队列进行检索,实现页面输出的地域排序效果。本发明包括以下流程:建立基于行政区域划分的地理信息库→建立相邻关系信息库→权重修正→页面检索。所述流程具体如下:
1.建立基于行政区域划分的地理信息库:
建立地理信息库主要有两个方面:
1)、权重的划分:由于按照行政区域划分,因此各省的信息结构相似,本方案以四川省为例,分别为属于四川省的各市赋予相同权重,为属于四川省的各县(区)赋予相同权重,为属于四川省的各镇赋予相同权重,最后为各村赋予相同权重,其省,市,县(区),镇,村的权重值逐级递增;
2)、地理信息组织:地理信息主要是以行政区划分,以树状图形式组织(其意义在于既作为地理信息库,又作为相邻关系信息库中每个图的索引入口),便于算法的检索(如以绵阳市为例,要查询绵阳市的北川县相关信息就以四川省- 绵阳市树状关系为入口,在绵阳市范围内以其下一层级县级来获取所有县区的邻接关系图)。
2.建立相邻关系信息库:
建立相邻关系信息库按照如下所示来建立。
1).建立相邻关系图:以“村”为例,在同一个镇的村之间的地理关系是确定的,因此利用此原理,将地图上的同一个镇的每个地理相邻村之间都用一条线来表示,将现有的地理关系抽象成数据结构中的图关系,其中,每个节点代表一个村,利用稀疏矩阵将每个镇的村与村的关系组织起来。基于以上原理,同一个县(区)的镇、市的县、省的市都可以按照相应的方法组织起来。其中可能存在的问题在于两个相邻村分属不同的两个镇(镇、区(县)、市、省类似) (定义为边界情况),对于这种情况可以通过单独建立这种特殊情况下的图来解决,其建立过程为:将边界村全部列出来,将其地理关系按照上述方法建立图,以稀疏矩阵存储。通过已经建立的同级相邻关系图以及特殊图可以将所有的情况都解决掉。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南科技大学,未经西南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310260778.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:空气除臭杀菌装置及其方法
- 下一篇:一种风机叶片及采用该叶片的风机