[发明专利]确定查询词权重方法、装置、电子设备及存储介质在审
申请号: | 202210814483.3 | 申请日: | 2022-07-12 |
公开(公告)号: | CN115292382A | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 王晓珂 | 申请(专利权)人: | 北京创鑫旅程网络技术有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/2457;G06F16/248 |
代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 李志新;金惠淑 |
地址: | 100015 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 查询 权重 方法 装置 电子设备 存储 介质 | ||
1.一种确定查询词权重方法,其特征在于,所述确定查询词权重的方法包括:
获取查询语句中待确定权重的查询词;
对所述查询词进行向量化,得到所述查询词的向量;
将所述查询词的向量输入至用于确定查询词权重的模型;
基于模型输出结果,确定所述查询词的权重。
2.根据权利要求1所述的方法,其特征在于,所述模型基于偏序对集合预先训练;
所述偏序对集合中的每一偏序对包括同一查询语句中的至少两个查询词,以及所述至少两个查询词在所述查询语句中的相对权重。
3.根据权利要求2所述的方法,其特征在于,所述偏序对集合采用如下方式确定:
确定语句集合,并确定所述语句集合中的每一语句中所包括的查询词;
标注同一语句中各查询词之间的相对权重,得到同一语句所对应的偏序对子集合;
将所述语句集合中各语句对应的偏序对子集合,组合为偏序对集合。
4.根据权利要求3所述的方法,其特征在于,标注所述查询词之间的相对权重,得到同一语句所对应的偏序对子集合,包括:
基于同一语句中包括的查询词,确定至少两个偏序对,其中,每一偏序对中包括至少两个查询词,且查询词数量小于所述同一语句中查询词总数量;
对所述至少两个偏序对中各偏序对分别标注查询词之间的相对权重,得到同一语句所对应的偏序对子集合。
5.根据权利要求2至4中任意一项所述的方法,其特征在于,所述模型采用如下方式基于偏序对集合预先训练:
确定偏序对集合,并确定所述偏序对集合中各查询词的向量;
将偏序对集合中各偏序对中查询词的向量作为输入特征,并将偏序对集合中各偏序对中查询词的相对权重,作为输出特征,进行模型训练,得到用于确定查询词权重的模型。
6.根据权利要求5所述的方法,其特征在于,确定所述语句集合中各语句中所包括查询词的查询词向量,包括:
确定所述语句集合中各语句中所包括查询词在各语句中的基本属性及与各查询词之间的关系属性、频次属性、在各语句中前后查询词的词性;
将所述查询词在各语句中的基本属性与各查询词的关系属性、所述频次属性以及所述在各语句中前后查询词的词性中各自包括的子属性的属性值,形成所述查询词的查询词向量。
7.根据权利要求1或2所述的方法,其特征在于,所述查询词的数量为多个;
所述基于模型输出结果,确定所述查询词的权重,包括:
确定多个查询词中的每一查询词各自模型输出结果所对应的初始权重;
对所述多个查询词的初始权重进行归一化处理,得到所述多个查询词中每一查询词的目标权重。
8.一种确定查询词权重的装置,其特征在于,所述确定查询词权重的装置包括:
获取单元,用于获取查询语句中待确定权重的查询词;
向量化单元,用于对所述查询词进行向量化,得到所述查询词的向量;
处理单元,用于将所述查询词的向量输入至预先训练的模型,得到所述查询词的权重。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储指令;以及
处理器,用于调用所述存储器存储的指令执行如权利要求1至7中任一项所述的确定查询词权重方法。
10.一种存储介质,其特征在于,所述存储介质中存储有指令,所述指令被处理器执行时,执行如权利要求1至7中任一项所述的确定查询词权重方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京创鑫旅程网络技术有限公司,未经北京创鑫旅程网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210814483.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:隧道缺陷处理方法
- 下一篇:一种无感生命健康体征参数测量仪