[发明专利]一种基于向量搜索引擎的知识库问题添加方法及装置在审
申请号: | 202111373119.X | 申请日: | 2021-11-19 |
公开(公告)号: | CN114064874A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 候雪飞 | 申请(专利权)人: | 浙江百应科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/31;G06F16/33 |
代理公司: | 杭州浙言专利代理事务所(普通合伙) 33370 | 代理人: | 易朝晖 |
地址: | 311121 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 向量 搜索引擎 知识库 问题 添加 方法 装置 | ||
1.一种基于向量搜索引擎的知识库问题添加方法,其特征是,所述方法包括:
提取知识库各场景下的场景问题,将每一所述场景问题的至少一个相似问句
转换为特征向量存入Milvus库中;
对所述Milvus库中的每个所述相似问句的特征向量进行存储并建立索引;
获取新增问句,将所述新增问句转换为特征向量,并在所述Milvus库中对所
述新增问句的特征向量进行相似性检索获得第一相似问句以及相似概率,其中,所述第一相似问句的特征向量与所述新增问句的特征向量的相似概率最高;
基于所述相似概率确定是否将所述新增问句添加至所述Milvus库中。
2.根据权利要求1所述的一种基于向量搜索引擎的知识库问题添加方法,其特
征是,基于所述相似概率确定是否将所述新增问句添加至所述Milvus库中包括:
当所述相似概率不高于预设阈值时,将所述新增问句添加至所述Milvus库中。
3.根据权利要求1所述的一种基于向量搜索引擎的知识库问题添加方法,其特
征是,将每一所述场景问句的至少一个相似问句转换为特征向量包括:
利用SBERT对每个所述相似问句进行编码,经过池化操作后得到固定大小的每个所述相似问句的特征向量。
4.根据权利要求1所述的一种基于向量搜索引擎的知识库问题添加方法,其特
征是,将所述新增问句转换为特征向量包括:
利用SBERT对每个所述新增问句进行编码,经过池化操作后得到所述新增问
句的特征向量。
5.根据权利要求1所述的一种基于向量搜索引擎的知识库问题添加方法,其特
征是,对所述Milvus库中的每个所述相似问句的特征向量进行存储并建立索引后:
为每个所述相似问句分配ID,将所述ID、对应的所述相似问存储在数据库中。
6.一种基于向量搜索引擎的知识库问题添加装置,其特征是,所述装置包括:
第一提取单元,用于提取知识库各场景下的场景问题,将每一所述场景问题
的至少一个相似问句转换为特征向量存入Milvus库中;
第一存储单元,用于对所述Milvus库中的每个所述相似问句的特征向量进行
存储并建立索引;
第一获取单元,用于获取新增问句,将所述新增问句转换为特征向量,并在
所述Milvus库中对所述新增问句的特征向量进行相似性检索获得第一相似问句以及相似概率,其中,所述第一相似问句的特征向量与所述新增问句的特征向量的相似概率最高;
第一确定单元,用于基于所述相似概率确定是否将所述新增问句添加至所述
Milvus库中。
7.一种电子设备,其特征是,所述电子设备包括处理器和存储器,所述存储
器中存储有至少一条指令、至少一段程序、待码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器执行以实现如权利要求1-5任一项所述的基于向量搜索引擎的知识库问题添加方法。
8.一种计算机可读存储介质,其特征是,所述计算机可读存储介质中存储有
至少一条指令、至少一段程序、待码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器执行以实现如权利要求1-5任一项所述的基于向量搜索引擎的知识库问题添加方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江百应科技有限公司,未经浙江百应科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111373119.X/1.html,转载请声明来源钻瓜专利网。