[发明专利]一种兴趣点名称的识别方法和装置在审
申请号: | 201510642849.3 | 申请日: | 2015-09-30 |
公开(公告)号: | CN105159885A | 公开(公告)日: | 2015-12-16 |
发明(设计)人: | 王智广 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 赵娟 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 兴趣 名称 识别 方法 装置 | ||
1.一种兴趣点名称的识别方法,包括:
在网页中提取兴趣点数据;所述兴趣点数据包括兴趣点名称;
将标识同一对象的兴趣点名称设置为兴趣点名称集合;
从所述兴趣点名称集合中识别错误的第一目标兴趣点名称。
2.如权利要求1所述的方法,其特征在于,所述在网页中提取兴趣点数据的步骤包括:
查找针对网页配置的模板;
在所述网页中,依据所述模板指示的位置提取兴趣点数据。
3.如权利要求1或2所述的方法,其特征在于,所述兴趣点数据还包括兴趣点地址;
所述将标识同一对象的兴趣点名称设置为兴趣点名称集合的步骤包括:
判断所述兴趣点地址是否相同或相似;若是,则将所述兴趣点地址关联的兴趣点名称设置为兴趣点名称集合。
4.如权利要求1或2或3所述的方法,其特征在于,所述从所述兴趣点名称集合中识别错误的第一目标兴趣点名称的步骤包括:
在所述兴趣点名称集合中的兴趣点名称选取关键词;
依据所述关键词从所述兴趣点名称中识别错误第一的目标兴趣点名称。
5.如权利要求1或2或3或4所述的方法,其特征在于,所述在所述兴趣点名称集合中的兴趣点名称选取关键词的步骤包括:
对所述兴趣点名称集合中的兴趣点名称进行分词处理,获得一个或多个分词;
查找所述分词在预设的兴趣点集合中的第一词频;
将同一个兴趣点名称中第一词频最低的X个分词,作为所述兴趣点名称的关键词,其中,X为正整数。
6.如权利要求1或2或3或4或5所述的方法,其特征在于,所述在所述兴趣点名称集合中的兴趣点名称选取关键词的步骤还包括:
当所述分词与预设的地址数据匹配时,移除所述分词。
7.如权利要求1或2或3或4或5或6所述的方法,其特征在于,所述依据所述关键词从所述兴趣点名称中识别错误的第一目标兴趣点名称的步骤包括:
计算所述关键词在所述兴趣点名称集合中的第二词频;
将所述第二词频最低的Y个关键词所属的兴趣点名称确定为错误的第一目标兴趣点名称,其中,Y为正整数。
8.一种兴趣点名称的识别装置,包括:
兴趣点数据提取模块,适于在网页中提取兴趣点数据;所述兴趣点数据包括兴趣点名称;
兴趣点名称集合设置模块,适于将标识同一对象的兴趣点名称设置为兴趣点名称集合;
错误兴趣点名称识别模块,适于从所述兴趣点名称集合中识别错误的第一目标兴趣点名称。
9.如权利要求8所述的装置,其特征在于,所述兴趣点数据提取模块还适于:
查找针对网页配置的模板;
在所述网页中,依据所述模板指示的位置提取兴趣点数据。
10.如权利要求8或9所述的装置,其特征在于,所述兴趣点数据还包括兴趣点地址;
所述兴趣点名称集合设置模块还适于:
判断所述兴趣点地址是否相同或相似;若是,则将所述兴趣点地址关联的兴趣点名称设置为兴趣点名称集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510642849.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:分流机
- 下一篇:一种结构牢固的输送绳带