[发明专利]一种行业搜索领域收窄检索的方法及系统在审
申请号: | 202111017223.5 | 申请日: | 2021-08-31 |
公开(公告)号: | CN113836396A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 包伟 | 申请(专利权)人: | 深圳市世强元件网络有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/289;G06F40/30 |
代理公司: | 深圳市瑞方达知识产权事务所(普通合伙) 44314 | 代理人: | 郭方伟 |
地址: | 518000 广东省深圳市龙岗区坂田街道雪岗路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行业 搜索 领域 检索 方法 系统 | ||
本发明公开了一种行业搜索领域收窄检索的方法及系统,本方法通过接收用户输入的搜索内容,根据多个不同词性的词库进行分词,获得搜索词以及搜索词所属的词性,然后根据搜索词所属的词性来确定检索维度,最后根据搜索词的词元在对应的检索维度中进行收窄检索,从而在某一特定行业搜索领域中,即使搜索内容越多,也能精确识别用户意图,缩小搜索范围。
技术领域
本发明涉及行业搜索技术领域,尤其涉及一种行业搜索领域收窄检索的方法及系统。
背景技术
在常规搜索引擎技术中,许多用户认为输入的条件越多就越精确,搜索得到的内容就会越少,但实际上常规搜索引擎输入的内容越多,检索面就越宽泛,搜索得到的内容就越多。虽然常规搜索引擎会根据词频相关度排序内容,但在某些行业,词频不是决定排序的主要因素,所以对于某些特定行业的检索,收窄逻辑显的格外重要。
发明内容
本发明要解决的技术问题在于,针对现有技术存在的至少一个缺陷,提供一种。
本发明解决其技术问题所采用的技术方案是:构造一种行业搜索领域收窄检索的方法,包括以下步骤:
S1:接收用户输入的搜索内容,根据多个不同词性的词库进行分词,获得搜索词以及所述搜索词所属的词性;
S2:根据所述搜索词所属的词性来确定检索维度;
S3:根据所述搜索词的词元在对应的检索维度中进行收窄检索。
优选地,在本发明所述的行业搜索领域收窄检索的方法中,所述步骤S1之前还包括:
S0:预先建立一行业中至少一垂直领域下的多个不同词性的词库。
优选地,在本发明所述的行业搜索领域收窄检索的方法中,各所述词库中分别记载有其词性下的多个关键词,且各所述词库间的关键词互不相同。
优选地,在本发明所述的行业搜索领域收窄检索的方法中,所述步骤S1中,根据多个不同词性的词库进行分词,包括:
根据多个不同词性的词库中的关键词来对所述搜索内容进行切割。
优选地,在本发明所述的行业搜索领域收窄检索的方法中,所述步骤S1还包括:
判断所述搜索词所属的词性个数是否大于或等于两个,若是,则将所述搜索词作为普通词。
优选地,在本发明所述的行业搜索领域收窄检索的方法中,所述方法还包括:
S4:对分词后剩下的搜索内容按自然语义进行分词,获得普通词;
S5:根据所述普通词的词元在多个检索维度中进行扩宽检索。
优选地,在本发明所述的行业搜索领域收窄检索的方法中,所述步骤S3和所述步骤S5之前,还包括:
对所述搜索词进行加权重,对所述普通词进行降权重。
优选地,在本发明所述的行业搜索领域收窄检索的方法中,所述步骤S4还包括:对分词后剩下的搜索内容中的助词和/或代词进行过滤。
本发明还构造了一种行业搜索领域收窄检索的系统,包括:
接收模块,用于接收用户输入的搜索内容;
分词模块,用于根据多个不同词性的词库进行分词,获得搜索词以及所述搜索词所属的词性;
维度确定模块,用于根据所述搜索词所属的词性来确定检索维度;
收窄检索模块,用于根据所述搜索词的词元在对应的检索维度中进行收窄检索。
优选地,在本发明所述的行业搜索领域收窄检索的系统中,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世强元件网络有限公司,未经深圳市世强元件网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111017223.5/2.html,转载请声明来源钻瓜专利网。