[发明专利]基于相互学习的问诊快捷回复推荐方法、装置及电子设备有效
申请号: | 202210275540.5 | 申请日: | 2022-03-21 |
公开(公告)号: | CN114639489B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 黄嘉健;刘永涛 | 申请(专利权)人: | 广东莲藕健康科技有限公司 |
主分类号: | G16H80/00 | 分类号: | G16H80/00;G06F16/332;G06F16/335;G06N20/00 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 王凯 |
地址: | 510000 广东省广州市白*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 相互 学习 问诊 快捷 回复 推荐 方法 装置 电子设备 | ||
1.一种基于相互学习的问诊快捷回复推荐方法,其特征在于,包括:
构建话术语料库,所述话术语料库包括:业务人员归纳总结的通用话术、医生输入文本中的高频话术以及医生设置的常见快捷回复话术;
基于所述话术语料库,对历史问诊对话中包括话术语料库中话术的问诊数据进行筛选,得到筛选的问诊数据;
基于所述筛选的问诊数据,构建数据集,所述数据集包含问诊信息、对话上下文、当前回复和负样本列表四部分;其中,所述基于所述筛选的问诊数据,构建数据集,包括:获取所述对话上下文对应的患者问诊信息,并将所述问诊信息加入数据集,所述问诊信息包括字段名和字段值;
基于当前对话上下文,利用检索模型和排序模型从所述话术语料库筛选回复推荐话术;
其中,所述检索模型和排序模型是基于所述数据集利用相互学习的框架进行迭代交替训练得到的;所述检索模型和所述排序模型采用预训练语言模型BERT作为文本编码器,并将BERT词表里的保留项替换成所述问诊信息的字段名,对所述数据集中对话上下文或所述当前对话上下文编码时,在所述问诊信息各字段名后加入相应字段值,以将所述问诊信息拼接到对话上下文的文本前;其中,所述检索模型和所述排序模型分别采用Bi-encoder和Cross Encoder架构进行编码。
2.根据权利要求1所述的方法,其特征在于,所述基于所述筛选的问诊数据,构建数据集,还包括:
将所述筛选的问诊数据中匹配所述话术语料库的话术作为当前回复,加入数据集;
将所述当前回复前的历史对话作为所述当前回复对应的对话上下文,加入数据集;
获取从历史问诊对话里对医生回复的话术随机采样的回复话术,作为所述当前回复对应的负样本,加入数据集。
3.根据权利要求1所述的方法,其特征在于,所述对历史问诊对话中包括话术语料库中话术的问诊数据进行筛选,包括:
基于所述话术语料库中的话术,根据每个样本里每轮对话的匹配程度进行打分,得到每个样本的匹配得分;
根据所述样本得分,对所述历史问诊对话数据进行初步筛选和抽样;
对所述初步筛选的问诊数据进行再次筛选,去除相似数据。
4.根据权利要求1所述的方法,其特征在于,所述基于当前对话上下文,利用检索模型和排序模型从所述话术语料库筛选回复推荐话术,包括:
利用所述检索模型,计算所述话术语料库中各话术作为当前对话上下文的回复的得分,将得分较高的话术作为候选话术;
利用所述排序模型,重新计算上述候选话术得分,作为各候选话术的最终得分,或者结合所述检索模型的打分得到各候选话术的最终得分;
根据各候选话术的最终得分,筛选出回复得分较高的话术作为回复推荐话术。
5.根据权利要求1所述的方法,其特征在于,所述基于所述数据集利用相互学习的框架进行迭代交替训练为重复执行交替训练的步骤,包括:
基于所述数据集中一批数据,分别计算检索模型与排序模型的预测输出;
根据所述检索模型与排序模型的预测输出,采用梯度下降法更新检索模型的参数;
基于更新参数后的检索模型,重新计算检索模型的预测输出;
根据所述重新计算检索模型的预测输出与排序模型的预测输出,采用梯度下降法更新排序模型的参数;
基于更新参数后的排序模型,重新计算排序模型的预测输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东莲藕健康科技有限公司,未经广东莲藕健康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210275540.5/1.html,转载请声明来源钻瓜专利网。