[发明专利]一种行业搜索领域收窄检索的方法及系统在审
申请号: | 202111017223.5 | 申请日: | 2021-08-31 |
公开(公告)号: | CN113836396A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 包伟 | 申请(专利权)人: | 深圳市世强元件网络有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/289;G06F40/30 |
代理公司: | 深圳市瑞方达知识产权事务所(普通合伙) 44314 | 代理人: | 郭方伟 |
地址: | 518000 广东省深圳市龙岗区坂田街道雪岗路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行业 搜索 领域 检索 方法 系统 | ||
1.一种行业搜索领域收窄检索的方法,其特征在于,包括以下步骤:
S1:接收用户输入的搜索内容,根据多个不同词性的词库进行分词,获得搜索词以及所述搜索词所属的词性;
S2:根据所述搜索词所属的词性来确定检索维度;
S3:根据所述搜索词的词元在对应的检索维度中进行收窄检索。
2.根据权利要求1所述的行业搜索领域收窄检索的方法,其特征在于,所述步骤S1之前还包括:
S0:预先建立一行业中至少一垂直领域下的多个不同词性的词库。
3.根据权利要求2所述的行业搜索领域收窄检索的方法,其特征在于,各所述词库中分别记载有其词性下的多个关键词,且各所述词库间的关键词互不相同。
4.根据权利要求3所述的行业搜索领域收窄检索的方法,其特征在于,所述步骤S1中,根据多个不同词性的词库进行分词,包括:
根据多个不同词性的词库中的关键词来对所述搜索内容进行切割。
5.根据权利要求4所述的行业搜索领域收窄检索的方法,其特征在于,所述步骤S1还包括:
判断所述搜索词所属的词性个数是否大于或等于两个,若是,则将所述搜索词作为普通词。
6.根据权利要求1或5所述的行业搜索领域收窄检索的方法,其特征在于,所述方法还包括:
S4:对分词后剩下的搜索内容按自然语义进行分词,获得普通词;
S5:根据所述普通词的词元在多个检索维度中进行扩宽检索。
7.根据权利要求6所述的行业搜索领域收窄检索的方法,其特征在于,所述步骤S3和所述步骤S5之前,还包括:
对所述搜索词进行加权重,对所述普通词进行降权重。
8.根据权利要求6所述的行业搜索领域收窄检索的方法,其特征在于,所述步骤S4还包括:对分词后剩下的搜索内容中的助词和/或代词进行过滤。
9.一种行业搜索领域收窄检索的系统,其特征在于,包括:
接收模块,用于接收用户输入的搜索内容;
分词模块,用于根据多个不同词性的词库进行分词,获得搜索词以及所述搜索词所属的词性;
维度确定模块,用于根据所述搜索词所属的词性来确定检索维度;
收窄检索模块,用于根据所述搜索词的词元在对应的检索维度中进行收窄检索。
10.根据权利要求9所述的行业搜索领域收窄检索的系统,其特征在于,还包括:
建立模块,用于预先建立一行业中至少一垂直领域下的多个不同词性的词库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世强元件网络有限公司,未经深圳市世强元件网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111017223.5/1.html,转载请声明来源钻瓜专利网。