[发明专利]医疗实体识别模型的训练方法、医疗实体识别方法及装置在审
申请号: | 202211268405.4 | 申请日: | 2022-10-17 |
公开(公告)号: | CN115545032A | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 袁晟君;吴汇哲 | 申请(专利权)人: | 太保科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/151;G06F40/103;G16H10/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 曹伟 |
地址: | 200010 上海市黄浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 实体 识别 模型 训练 方法 装置 | ||
1.一种医疗实体识别模型的训练方法,其特征在于,所述方法包括:
获取待训练数据;
获取目标实体属性信息,所述目标实体属性信息用于指示实体的属性;
根据目标实体属性信息,利用所述训练数据训练实体识别模型,所述实体识别模型用于对属性与所述目标实体类型信息所指示的属性相匹配的实体的进行识别。
2.根据权利要求1所述的方法,其特征在于,所述目标实体属性信息,包括以下任意一项或多项:
实体类型、实体类型的定义和实体类型的样例。
3.根据权利要求1所述的方法,其特征在于,所述根据目标实体属性信息,利用所述训练数据训练实体识别模型,包括:
根据目标实体属性信息对所述待训练数据进行数据格式转换,得到数据格式转换后的待训练数据;所述数据格式转换后的待训练数据为多条具有不同目标实体属性信息标注的待训练数据;
利用所述格式转换后的待训练数据训练实体识别模型。
4.根据权利要求3所述的方法,其特征在于,所述利用所述格式转换后的待训练数据训练实体识别模型,包括:
利用所述格式转换后的待训练数据,对于待训练数据中不存在的目标实体属性信息对应实体,训练医疗实体识别模型生成基于目标实体属性信息识别的负样本。
5.一种医疗实体识别方法,其特征在于,所述方法包括:
获取待处理的文本数据;
获取目标实体属性信息,所述目标实体属性信息用于指示实体的属性;
根据实体识别模型,基于所述目标实体属性信息,对所述待处理的文本数据进行识别,得到实体识别结果,所述实体识别结果对应的实体的属性与所述目标实体属性信息所指示的属性相匹配。
6.一种医疗实体识别模型的训练装置,其特征在于,包括:
第三获取模块,获取待训练数据;
第四获取模块,获取目标实体属性信息,所述目标实体属性信息用于指示实体的属性;
训练模块,根据目标实体属性信息,利用所述训练数据训练实体识别模型,所述实体识别模型用于对属性与所述目标实体类型信息所指示的属性相匹配的实体的进行识别。
7.根据权利要求6所述的装置,其特征在于,所述装置包括:
转换单元,根据目标实体属性信息对所述待训练数据进行数据格式转换,得到数据格式转换后的待训练数据;所述数据格式转换后的待训练数据为多条具有不同目标实体属性信息标注的待训练数据;
第一训练单元,利用所述格式转换后的待训练数据训练实体识别模型。
8.一种医疗实体识别装置,其特征在于,包括:
第一获取模块,获取待处理的文本数据;
第二获取模块,获取目标实体属性信息,所述目标实体属性信息用于指示实体的属性;
识别模块,根据实体识别模型,基于所述目标实体属性信息,对所述待处理的文本数据进行识别,得到实体识别结果,所述实体识别结果对应的实体的属性与所述目标实体属性信息所指示的属性相匹配。
9.一种电子设备,其特征在于,包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使,所述处理器执行权利要求1至4任一项所述的医疗实体识别模型的训练方法的任一实现方式,或者,所述处理器执行权利要求5所述的医疗实体识别方法的任一实现方式。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行权利要求1至4任一项所述的医疗实体识别模型的训练方法的任一实现方式,或者,使得所述终端设备执行权利要求5所述的医疗实体识别方法的任一实现方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太保科技有限公司,未经太保科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211268405.4/1.html,转载请声明来源钻瓜专利网。