[发明专利]一种搜索方法及装置在审
申请号: | 201810135624.2 | 申请日: | 2018-02-09 |
公开(公告)号: | CN110134850A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 邸楠 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/583;G06F16/33 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 葛聪慧;王宝筠 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标图片 搜索结果 搜索 文本内容 搜索方法及装置 目标网页 网页 相似度 查找 图片 语义分析 预设 | ||
1.一种搜索方法,其特征在于,所述方法包括:
获取目标图片,查找与所述目标图片相关的目标网页;所述目标网页包括所述目标图片的相似图片,所述目标图片的相似图片是与所述目标图片相似度大于预设相似度阈值的图片;
获取所述目标图片对应的文本内容,对所述文本内容进行语义分析确定搜索意图;所述文本内容是对基于所述目标图片的搜索意图的文本描述;
从所述目标网页中查找符合所述搜索意图的搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述从所述目标网页中查找符合所述搜索意图的搜索结果包括:
从所述目标网页中,获得与所述目标图片和所述文本内容都相关的网页文本;
从所述网页文本中查找符合所述搜索意图的搜索结果。
3.根据权利要求2所述的方法,其特征在于,所述从所述目标网页中,获得与所述目标图片和所述文本内容都相关的网页文本包括:
从所述目标网页中,获得与所述目标图片位置相关的待选网页文本;所述位置相关,指的是在所述目标网页中,所述待选网页文本的位置,与所述目标图片的相似图片的位置,在预设位置范围内;
从所述待选网页文本中,获得与所述文本内容语义相关的网页文本。
4.根据权利要求2-3任意一项所述的方法,其特征在于,所述从所述网页文本中查找符合所述搜索意图的搜索结果包括:
获取所述网页文本中命中预设的实体词词典的实体词集合;
从所述实体词集合中查找符合所述搜索意图的目标实体词作为所述搜索结果。
5.根据权利要求4所述的方法,其特征在于,所述从所述实体词集合中查找符合所述搜索意图的目标实体词作为所述搜索结果包括:
根据所述实体词集合中各个实体词与所述文本内容中的关键词的语义相似度,获取符合所述搜索意图的目标实体词作为搜索结果。
6.根据权利要求4所述的方法,其特征在于,所述从所述实体词集合中查找符合所述搜索意图的目标实体词作为所述搜索结果包括:
根据第一参考条件和第二参考条件,从所述实体词集合中查找符合所述搜索意图的目标实体词作为所述搜索结果;
其中,所述第一参考条件包括所述实体词集合中各个实体词与所述文本内容中的关键词的语义相似度;
所述第二参考条件包括第一子参考条件、第二子参考条件、以及第三子参考条件中的任意一种或多种;所述第一子参考条件包括所述实体词集合中各个实体词的相邻文本与所述文本内容的相似度;所述第二子参考条件包括所述实体词集合中各个实体词对应的预设的百科词条与所述文本内容的相似度;所述第三子参考条件包括所述实体词集合中各个实体词在所述网页文本中出现的词频。
7.根据权利要求5-6任意一项所述的方法,其特征在于,所述文本内容中的关键词通过以下方式获取:
对所述文本内容进行分词;
采用依存句法分析算法确定分词后所获得的各个词语之间的依存关系;
根据各个词语之间的依存关系,确定能够表征搜索意图的关键词,作为所述文本内容中的关键词。
8.一种搜索装置,其特征在于,所述装置包括:
目标网页查找单元,用于获取目标图片,查找与所述目标图片相关的目标网页;所述目标网页包括所述目标图片的相似图片,所述目标图片的相似图片是与所述目标图片相似度大于预设相似度阈值的图片;
搜索意图分析单元,用于获取所述目标图片对应的文本内容,对所述文本内容进行语义分析确定搜索意图;所述文本内容是对基于所述目标图片的搜索意图的文本描述;
搜索结果查找单元,用于从所述目标网页中查找符合所述搜索意图的搜索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810135624.2/1.html,转载请声明来源钻瓜专利网。