[发明专利]一种识别搜索关键词的方法和装置有效
申请号: | 201510158351.X | 申请日: | 2015-04-03 |
公开(公告)号: | CN104765815B | 公开(公告)日: | 2016-11-09 |
发明(设计)人: | 薛永刚;贾文杰;项碧波 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/00 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝;何立春 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 搜索关键词 方法 装置 | ||
1.一种识别搜索关键词的方法,其中,该方法包括:
响应于用户触屏操作,按照所述操作范围进行图片截取,获得第一图片;再按照所述操作范围扩大预定面积进行图片截取,获得第二图片;
分别识别第一图片和第二图片中的字符,得到相应的字符组合;
根据预设策略,从第一图片和第二图片对应的字符组合中选择一个字符组合作为识别后的搜索关键词。
2.如权利要求1或2所述的方法,其中,所述分别识别第一图片和第二图片中的字符,得到相应的字符组合包括:对于一个图片,
识别该图片所包含的字符占位,获取每个字符占位对应的候选字符集合以及每个候选字符对应的概率参数;按照该图片所包含的各字符占位的顺序,依次从每个字符占位对应的候选字符集合中选取一个候选字符得到一个候选字符组合;进行多次选取,每次选取到不同的字符组合,得到多个候选字符组合;计算所得到的每个候选字符组合的概率,将概率最高的候选字符组合作为与该图片相应的字符组合。
3.如权利要求1-2中任一项所述的方法,其中,所述计算所得到的每个候选字符组合的概率为:
基于n元语法模型,计算所得到的每个候选字符组合的概率。
4.如权利要求1-3中任一项所述的方法,其中,所述基于n元语法模型,计算所得到的每个候选字符组合的概率包括:
对于一个候选字符组合中的每个候选字符,根据各候选字符的概率参数,计算该候选字符在其前n-1个候选字符已经确定的条件下出现的条件概率;
计算该候选字符组合中各候选字符的条件概率的乘积,作为该候选字符组合的概率。
5.如权利要求1-4中任一项所述的方法,其中,所述根据预设策略,从第一图片和第二图片对应的字符组合中选择一个字符组合作为搜索关键词包括:
在第二图片对应的字符组合中,保留与第一图片对应的字符组合位置相同且长度相同字符组合;
判断第二图片中保留的字符组合的平均语言模型分数是否小于第一图片对应的字符组合的平均模型分数;
是则,选择第一图片对应的字符组合作为搜索关键词进行搜索;
否则,选择第二图片对应的字符组合作为搜索关键词进行搜索。
6.如权利要求1-5中任一项所述的方法,其中,所述分别识别第一图片和第二图片中的字符,得到相应的字符组合进一步包括:得到字符组合中各字符占位的像素坐标。
7.如权利要求1-6中任一项所述的方法,其中,所述在第二图片对应的字符组合中,保留与第一图片对应的字符组合位置相同且长度相同的字符组合是指:
根据第一图片和第二图片分别对应的字符组合的像素坐标边界和每个字符占位的像素坐标,保留第二图片中与第一图片对应的字符组合位置相同且长度相同字符组合。
8.如权利要求1-7中任一项所述的方法,其中,所述字符组合的平均语言模型分数是指:字符组合的概率的对数值,按照字符组合中的字符数取平均后得到的值。
9.一种识别搜索关键词的装置,其中,该装置包括:
图片获取单元,适于响应于用户触屏操作,按照所述操作范围进行图片截取,获得第一图片;再按照所述操作范围扩大预定面积进行图片截取,获得第二图片;
识别处理单元,适于分别识别第一图片和第二图片中的字符,得到相应的字符组合;
搜索处理单元,适于根据预设策略,从第一图片和第二图片对应的字符组合中选择一个字符组合作为识别后的搜索关键词。
10.如权利要求9所述的装置,其中,所述识别处理单元包括:
获取单元,适于识别一个图片所包含的字符占位,获取每个字符占位对应的候选字符集合以及每个候选字符对应的概率参数;
预处理单元,适于按照所述图片所包含的各字符占位的顺序,依次从每个字符占位对应的候选字符集合中选取一个候选字符得到一个候选字符组合;进行多次选取,每次选取到不同的字符组合,得到多个候选字符组合;
识别单元,适于计算所得到的每个候选字符组合的概率,将概率最高的候选字符组合作为对所述图片的字符识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510158351.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于特征提取算法的数据特征分类方法
- 下一篇:一种文件命名方法及装置