[发明专利]连锁品牌词词库、类别词词库建立方法和装置有效
申请号: | 201310439450.6 | 申请日: | 2013-09-24 |
公开(公告)号: | CN104462143B | 公开(公告)日: | 2018-01-30 |
发明(设计)人: | 刘广权 | 申请(专利权)人: | 高德软件有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王宝筠 |
地址: | 102200 北京市昌*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了连锁品牌词、类别词词库建立方法和装置。一种情况下,基于同一城市POI数据库中的POI数据进行连锁品牌词识别器的训练,利用该连锁品牌词识别器可对POI数据库中所有POI数据的名称主干进行识别,识别出是连锁品牌词的名称主干,并将其存储在连锁品牌词词库中。另一种情况下,基于用户查询日志中记录的查询词和与查询词对应的被点击的POI数据进行识别器的训练,利用该识别器可对用户查询日志中记录的所有查询词进行识别,识别出是连锁品牌词和类别词的查询词,并分别将其存储在连锁品牌词词库和类别词词库中。根据本发明实施例,不仅提高了工作效率,还可以通过定时挖掘,实现及时更新词库。 | ||
搜索关键词: | 连锁 品牌 词库 类别 建立 方法 装置 | ||
【主权项】:
一种连锁品牌词词库建立方法,其特征在于,包括:将同一城市兴趣点POI数据库中名称主干相同的POI数据聚合成一个POI数据组,所述POI数据组与所述名称主干对应;从各个POI数据组中提取所述POI数据组的识别特征;从所有POI数据组中抽取出名称主干已被标记为连锁品牌词和非连锁品牌词的POI数据组作为训练数据,基于所述训练数据的识别特征进行连锁品牌词识别器的训练;利用训练后的所述连锁品牌词识别器对所有POI数据组对应的名称主干中未识别的名称主干进行识别,识别出是连锁品牌词的名称主干;将所述是连锁品牌词的名称主干存储在预置的连锁品牌词词库中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高德软件有限公司,未经高德软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310439450.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种兴趣点父子关系的建立方法及装置
- 下一篇:网页数据采集方法及装置