[发明专利]文章搜索方法、装置及电子设备有效
申请号: | 201810680189.1 | 申请日: | 2018-06-27 |
公开(公告)号: | CN108932320B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 潘岸腾 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 余西西;马佑平 |
地址: | 310051 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文章 搜索 方法 装置 电子设备 | ||
本发明公开了一种文章搜索方法、装置及电子设备。该方法包括:接收用户的文章搜索操作,获取对应的目标搜索词的搜索分词集合;根据搜索分词集合,获取目标搜索词与文章数据库所包括的每个候选文章之间的相关性评分;将相关性评分符合预设的搜索条件的候选文章,作为搜索结果提供给用户。根据本发明,可以在用户搜索文章时向用户提供与搜索词相关性较高的文章,更精准满足用户的文章搜索需求。
技术领域
本发明涉及搜索技术领域,更具体地,涉及一种文章搜索方法、装置及电子设备。
背景技术
文章搜索功能是计算机软件程序、移动终端应用(APP)中可支持的最基本的应用功能。
目前文章搜索功能的实现,通常是根据用户输入的搜索词进行搜索,搜索到包括与该搜索词匹配的关键词的文章时,将该文章作为搜索结果提供给用户。
但是,这种文章搜索方法并不能搜索到包括与搜索词存在相关性的相关词的文章,例如,用户输入搜索词“理财”,可以搜索出包括“理财”这一关键词的文章,但是,却无法搜索出不包括“理财”但是包括与“理财”存在相关性的相关词“投资”或者“基金”的文章。
发明内容
本发明的一个目的是提供一种用于文章搜索的新技术方案。
根据本发明的第一方面,提供了一种文章搜索方法,其中,包括:
接收用户的文章搜索操作,获取对应的目标搜索词的搜索分词集合;
根据所述搜索分词集合,获取所述目标搜索词与文章数据库所包括的每个候选文章之间的相关性评分;
将所述相关性评分符合预设的搜索条件的候选文章,作为搜索结果提供给用户。
可选地,所述获取搜索分词集合的步骤包括:
获取与所述文章搜索操作对应的目标搜索词;
将所述目标搜索词进行分词处理,得到多个搜索分词以构成所述搜索分词集合。
可选地,所述获取所述目标搜索词与每个所述候选文章之间的相关性评分的步骤包括:
对该候选文章进行分词处理,得到多个候选文章分词以构成对应的候选文章分词集合;
根据所述搜索分词集合、所述候选文章分词集合,计算目标搜索词与该候选文章之间的相关性评分。
可选地,所述计算目标搜索词与该候选文章之间的相关性评分的步骤包括:
对所述搜索分词集合中包括的每一个搜索分词,分别获取该搜索分词与每个所述候选文章分词之间的分词相关值;
根据所述搜索分词集合包括搜索分词的数目、所述候选文章分词集合中的候选文章分词的数目以及全部所述分词相关值,计算得到所述相关性评分。
可选地,所述获取分词相关值的步骤包括:
对所述文章数据库中包括的全部所述候选文章进行分词,获取包括所述搜索分词的候选文章的第一文章集合以及包括所述候选文章分词的第二文章集合;
获取所述第一文章集合与所述第二文章集合的文章交集,以及所述第一文章集合与所述第二文章集合的文章并集;
根据所述文章交集所包括的文章数目,以及所述文章并集所包括的文章数目,计算获取所述分词相关值。
可选地,所述计算得到所述相关性评分的步骤包括:
根据所述搜索分词的数目、所述候选文章分词的数目,计算得到相关性系数;
根据全部所述分词相关值求和得到的结果值以及所述相关性系数,计算所述相关性评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810680189.1/2.html,转载请声明来源钻瓜专利网。