[发明专利]数据处理方法、装置、设备及存储介质在审
申请号: | 202111531760.1 | 申请日: | 2021-12-14 |
公开(公告)号: | CN114329102A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 李佳;张云燕;杨奕凡 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F11/34;G06K17/00 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 李文静 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 设备 存储 介质 | ||
本申请关于一种数据处理方法、装置、设备及存储介质,涉及人工智能技术领域。方法包括:获取输入样本集;将输入样本集中的样本分别输入当前模型和历史模型;获得第一样本特征以及第二样本特征;基于第一样本特征以及第二样本特征获取蒸馏损失值;基于第一样本特征获取预测损失值;基于蒸馏损失值以及预测损失值,对当前模型进行参数更新;本方案在保证模型分类效果的情况下,提高了新增事件类别时的模型训练的效率。
技术领域
本申请涉及人工智能技术领域,特别涉及一种数据处理方法、装置、设备及存储介质。
背景技术
随着人工智能(Artificial Intelligence,AI)在医疗领域中的应用的不断发展,目前可以通过AI对医疗数据进行分类,以辅助医疗人员进行医疗相关的决策。
在相关技术中,可以通过深度神经网络进行医疗数据的事件分类;比如,开发人员可以预先收集若干条医疗数据作为数据样本,并各条数据样本分别标注出事件类别,通过数据样本以及标注出的事件类别训练一个医疗相关的事件分类模型,后续将新的医疗数据输入事件分类模型,可以得到相应的事件分类结果。
然而,在医疗领域中,会不断的出现新的类别的医疗数据,相应的,也就需要开发人员收集包含新的类别的医疗数据进行模型的重训练,严重影响了模型部署的效率,进而影响了事件分类的效率。
发明内容
本申请实施例提供了一种数据处理方法、装置、设备及存储介质,可以提高对事件数据进行事件分类的效率,该技术方案如下。
一方面,提供了一种数据处理方法,所述方法包括:
获取输入样本集,所述输入样本集中包含新增样本以及历史记忆样本;所述新增样本包括与第一事件类别对应的事件数据样本;所述历史记忆样本包括与至少一种第二事件类别分别对应的事件数据样本;
将所述输入样本集中的样本分别输入当前模型和历史模型;获得所述当前模型中的特征提取网络输出的第一样本特征,以及所述历史模型中的特征提取网络输出的第二样本特征;所述历史模型用于将输入的事件数据分类至所述至少一种第二事件类别;所述历史记忆样本是用于训练所述历史模型的数据样本的一部分;
基于所述第一样本特征以及所述第二样本特征获取蒸馏损失值,所述蒸馏损失值用于指示特征级蒸馏损失值、不确定性损失值以及预测级蒸馏损失值中的至少一种;所述特征级蒸馏损失值用于指示所述样本特征以及所述第二样本特征之间的差异;所述不确定性损失值用于指示所述当前模型和所述历史模型对预测的不确定程度之间的差异;所述预测级蒸馏损失值用于指示所述当前模型和所述历史模型的预测结果之间的差异;
基于所述第一样本特征,获取所述当前模型对所述输入样本集中的样本的预测结果;
基于所述当前模型对所述输入样本集中的样本的预测结果获取预测损失值;所述预测损失值用于指示所述当前模型对所述输入样本集中的样本的预测偏差;
基于所述蒸馏损失值以及所述预测损失值,对所述当前模型进行参数更新;其中,收敛后的所述当前模型用于将输入的事件数据分类至所述第一事件类别以及所述至少一种第二事件类别。
再一方面,提供了一种数据处理装置,所述装置包括:
样本集获取模块,用于获取输入样本集,所述输入样本集中包含新增样本以及历史记忆样本;所述新增样本包括与第一事件类别对应的事件数据样本;所述历史记忆样本包括与至少一种第二事件类别分别对应的事件数据样本;
样本特征获取模块,用于将所述输入样本集中的样本分别输入当前模型和历史模型;获得所述当前模型中的特征提取网络输出的第一样本特征,以及所述历史模型中的特征提取网络输出的第二样本特征;所述历史模型用于将输入的事件数据分类至所述至少一种第二事件类别;所述历史记忆样本是用于训练所述历史模型的数据样本的一部分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111531760.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可提高通信技术产品展示效果的展示机构
- 下一篇:一种兵棋棋盘生成方法