[发明专利]基于预训练模型的开放域问答预测方法及相关设备在审
申请号: | 202111167748.7 | 申请日: | 2021-09-30 |
公开(公告)号: | CN113723115A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 成杰峰;彭奕 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F16/35;G06F16/335;G06F16/242;G06F16/36;G06F40/284;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 训练 模型 开放 问答 预测 方法 相关 设备 | ||
1.一种基于预训练模型的开放域问答预测方法,其特征在于,所述方法包括:
采用预训练模型对输入的查询语句进行编码,得到所述查询语句的查询向量;
将所述查询向量与预先构建的聚类图谱中的至少一个片段簇进行匹配,以从所述至少一个片段簇中确定出所述查询语句所属的目标片段簇;
从所述目标片段簇中选取至少一个片段,根据至少一个片段得到更新的查询语句,并计算更新的查询语句与所述目标片段簇中的第一片段的后验概率;
重复执行根据上一次得到的后验概率从所述目标片段簇中选取至少一个片段、根据至少一个片段得到当前更新的查询语句的操作,直至所述目标片段簇中不存在与当前选取的至少一个片段直接相连的片段;
计算当前更新的查询语句与所述目标片段簇中的第二片段的目标后验概率,根据所述目标后验概率返回所述查询语句的开放域问答结果。
2.根据权利1所述的方法,其特征在于,所述至少一个片段簇是通过对各领域的片段数据进行聚类得到的,在采用预训练模型对输入的查询语句进行编码,得到所述查询语句的查询向量之前,所述方法还包括:
确定聚类算法中对各领域的片段数据进行聚类所采用的半径和邻域密度阈值;
基于所述半径和所述邻域密度阈值构建所述聚类图谱。
3.根据权利要求2所述的方法,其特征在于,所述确定聚类算法中对各领域的片段数据进行聚类所采用的半径,包括:
采用所述预训练模型对各领域的片段数据进行编码,得到至少一个语义向量;
对所述至少一个语义向量进行对数取样,得到第一目标数量个点;
计算所述第一目标数量个点的点间平均距离;
重复执行K次对所述至少一个语义向量进行对数取样和计算点间平均距离的操作,得到K个点间平均距离,其中,K为大于1的整数;
将所述K个点间平均距离的平均值作为所述半径。
4.根据权利要求3所述的方法,其特征在于,所述确定聚类算法中对各领域的片段数据进行聚类所采用的邻域密度阈值,包括:
对所述至少一个语义向量进行对数取样,得到第二目标数量个点;
从所述第二目标数量个点中随机选择一个点作为聚类中心,根据所述半径和预先定义的判别函数计算出聚类中心的同类点的数量;
重复执行K次对所述至少一个语义向量进行对数取样、随机选择一个点作为聚类中心和计算聚类中心同类点的数量的操作,得到K个数量值;
将所述K个数量值的平均值作为所述邻域密度阈值。
5.根据权利要求3所述的方法,其特征在于,所述基于所述半径和所述邻域密度阈值构建所述聚类图谱,包括:
从所述至少一个语义向量中的任一语义向量开始,根据所述半径获取所述任一语义向量的邻域点个数,若所述邻域点个数小于所述邻域密度阈值,则将所述任一语义向量确定为边界点,若所述邻域点个数大于或等于所述邻域密度阈值,则将所述任一语义向量确定为核心点;
若所述任一语义向量为核心点,则将所述任一语义向量密度可达的点和所述任一语义向量密度确定为片段簇,若所述任一语义向量为边界点,则将所述任一语义向量加入到与所述任一语义向量密度可达的核心点所属的片段簇中,直至所述至少一个语义向量中的核心点被聚类完毕,得到所述至少一个片段簇;
为所述至少一个片段簇中每个片段簇中的邻域点赋予一条边,得到所述聚类图谱。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述将所述查询向量与预先构建的聚类图谱中的至少一个片段簇进行匹配,以从所述至少一个片段簇中确定出所述查询语句所属的目标片段簇,包括:
针对所述至少一个片段簇中的每个片段簇,计算所述每个片段簇中的核心点的平均值;
将所述每个片段簇中的核心点的平均值作为所述每个片段簇的聚类中心;
计算所述查询向量与所述每个片段簇的聚类中心的目标距离;
将所述至少一个片段簇中所述目标距离最小的聚类中心所代表的的片段簇,确定为所述目标片段簇。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111167748.7/1.html,转载请声明来源钻瓜专利网。