[发明专利]基于互联网分词思想的车载导航POI搜索引擎无效
申请号: | 201010117242.0 | 申请日: | 2010-03-02 |
公开(公告)号: | CN101794307A | 公开(公告)日: | 2010-08-04 |
发明(设计)人: | 朱敦尧;党魁 | 申请(专利权)人: | 光庭导航数据(武汉)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G01C21/34 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 王超 |
地址: | 430074 湖北省武汉市洪山*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 互联网 分词 思想 车载 导航 poi 搜索引擎 | ||
1.基于互联网分词思想的车载导航POI搜索引擎,其特征在于包括以下步骤:
1)对POI原数据中的POI名称做分词处理;
2)根据分词结果生成POI搜索引擎信息索引;
3)根据POI搜索引擎信息索引进行POI名称查询。
2.根据权利要求1所述的方法,其特征在于步骤1)具体包括:
S101)从POI原数据中提取出POI的名称;
S102)将提取出来的POI名称保存为文本文件;
S103)将POI名称做分词处理:根据算法将文本文件中POI名称的中文分割为小于等于最大分词长度的中文关键词;数字和英文单词则各自分割为一个整体,分别生成数字关键词和英文关键词;并去除POI名称中的符号;
S104)将POI名称分词处理后生成的小于等于最大分词长度的中文关键词、数字关键词和英文关键词保存为分词结果。
3.根据权利要求1或2所述的方法,其特征在于步骤2)具体包括:
S201)将分词结果中的关键词生成首字母,其中中文关键词的首字母为拼音首字母;数字关键词的首字母为其本身;英文关键词的首字母为其小写字母;
S202)为分词结果建立字符0~9和a~z的首字母倒排索引;
S203)根据分词结果的关键词在POI名称中查找含有关键词的POI记录;
S204)将分词结果关键词查找的POI记录在数据中的地址和记录数量保存到该关键词的倒排索引中,最后生成POI搜索引擎信息索引。
4.根据权利要求3所述的方法,其特征在于:POI搜索引擎信息索引包括管理部数据块、首字母管理数据块、首字母索引数据块、关键词数据块、匹配结果索引数据块和实体数据块。
5.根据权利要求4所述的方法,其特征在于POI搜索引擎信息索引的各数据块具体结构为:
1)管理部数据块结构见表1:
表1管理部数据块结构
2)首字母管理数据块的结构见表2:
表2首字母管理数据块结构
3)首字母索引数据块的结构见表3:
表3首字母索引数据块结构
4)关键词数据块的结构见表4:
表4关键词数据块结构
5)POI匹配结果索引数据块的结构见表5:
表5POI匹配结果索引数据块结构
6)POI实体数据块的结构见表6:
表6POI实体数据块结构
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于光庭导航数据(武汉)有限公司,未经光庭导航数据(武汉)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010117242.0/1.html,转载请声明来源钻瓜专利网。