[发明专利]检测模型的跨域自适应方法、数据处理方法在审

专利信息
申请号: 202110602937.6 申请日: 2021-05-31
公开(公告)号: CN115481424A 公开(公告)日: 2022-12-16
发明(设计)人: 孙晋权 申请(专利权)人: 阿里巴巴新加坡控股有限公司
主分类号: G06F21/62 分类号: G06F21/62;G16H10/00;G06K9/62
代理公司: 北京博浩百睿知识产权代理有限责任公司 11134 代理人: 谢湘宁;张文华
地址: 新加坡珊顿道*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 检测 模型 自适应 方法 数据处理
【说明书】:

本申请公开了一种检测模型的跨域自适应方法、数据处理方法。其中,该数据处理方法包括:接收医疗设备采集到的医疗数据;采用目标检测模型抽取出上述医疗数据的文本信息,其中,上述目标检测模型是依据目标域上的无标注数据集的伪标签训练否定检测模型得到的,上述否定检测模型是基于源域上的标注数据集训练得到的,上述伪标签是基于上述否定检测模型对目标域上的无标注数据集的检测结果生成的;输出上述文本信息。本申请解决了现有技术中医疗领域中否定检测方法的标注成本较大,在数据传输受限情况下,无法实现否定检测模型的跨域自适应的技术问题。

技术领域

本申请涉及无源自适应领域,具体而言,涉及一种检测模型的跨域自适应方法、数据处理方法。

背景技术

否定检测是医学文本信息抽取中的重要任务之一。医学领域术语繁杂,行文方式多样、各医院格式要求不一,在一个医院或医联体数据上训练好的否定模型,很难在直接其他医院数据上也取得令人满意的效果;在数据不敏感领域,可以同时采集源域标注数据和目标域标注数据训练模型,但在实际场景中,医疗机构内部数据管理严格,“数据不出院”是大部分场景下的基本要求。

传统的医学文本否定检测方法,大多采用基于规则和手工特征的检测方法,无法准确捕捉复杂的语义信息,现有的基于深度学习的否定检测方法,都假设在单一领域标注数据量充足进行,不考虑跨领域情况下的模型适应情况,但是如果想要实现从源训练域到目标应用域的模型适应,则需要采集大量目标领域的标注数据,并在模型上做微调,如果想要取得更好的适应效果,则需要同时使用源领域和目标领域的标注数据。

针对上述的问题,目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种检测模型的跨域自适应方法、数据处理方法,以至少解决现有技术中医疗领域中否定检测方法的标注成本较大,在数据传输受限情况下,无法实现否定检测模型的跨域自适应的技术问题。

根据本申请实施例的一个方面,提供了一种检测模型的跨域自适应方法,包括:获取否定检测模型,其中,上述否定检测模型是基于源域上的标注数据集训练得到的;依据上述否定检测模型对目标域上的无标注数据集的检测结果,为上述无标注数据集生成伪标签;采用上述伪标签训练上述否定检测模型,得到适用于上述目标域的目标检测模型,其中,上述目标检测模型抽取上述目标域的文本信息。

根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:接收医疗设备采集到的医疗数据;采用目标检测模型抽取出上述医疗数据的文本信息,其中,上述目标检测模型是依据目标域上的无标注数据集的伪标签训练否定检测模型得到的,上述否定检测模型是基于源域上的标注数据集训练得到的,上述伪标签是基于上述否定检测模型对目标域上的无标注数据集的检测结果生成的;输出上述文本信息。

根据本申请实施例的一个方面,还提供了另一种数据处理方法,包括:云服务器接收来自客户端的医疗数据;上述云服务器采用目标检测模型抽取出上述医疗数据中的文本信息,其中,上述目标检测模型是依据目标域上的无标注数据集的伪标签训练否定检测模型得到的,上述否定检测模型是基于源域上的标注数据集训练得到的,上述伪标签是基于上述否定检测模型对目标域上的无标注数据集的检测结果生成的;上述云服务器返回上述文本信息至上述客户端。

根据本申请实施例的一个方面,还提供了另一种数据处理方法,包括:云服务器接收来自客户端的医疗数据;上述云服务器获取否定检测模型,其中,上述否定检测模型是基于源域上的标注数据集训练得到的;依据上述否定检测模型对目标域上的无标注数据集的检测结果,为上述无标注数据集生成伪标签,并采用上述伪标签训练上述否定检测模型,得到适用于上述目标域的目标检测模型;上述云服务器采用目标检测模型抽取出上述医疗数据中的文本信息;上述云服务器返回上述文本信息至上述客户端。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴新加坡控股有限公司,未经阿里巴巴新加坡控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110602937.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top