[发明专利]医疗数据处理方法及装置、存储介质、电子设备在审
申请号: | 201910736586.0 | 申请日: | 2019-08-09 |
公开(公告)号: | CN112347776A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 焦增涛 | 申请(专利权)人: | 金色熊猫有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/295;G06F40/30;G06N3/04;G06N3/08;G06F16/2458;G06F16/28 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 郑特强;章侃铱 |
地址: | 中国香港铜锣湾希慎*** | 国省代码: | 香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 数据处理 方法 装置 存储 介质 电子设备 | ||
1.一种医疗数据处理方法,其特征在于,包括:
利用预设规则对待处理医疗数据进行处理,得到多个候选医疗词;
将各所述候选医疗词输入至分类模型中得到多个输出结果;其中,所述分类模型是通过多个词向量对连体神经网络进行训练得到的;
根据所述输出结果的置信度判断各所述候选医疗词是否属于目标医疗词。
2.根据权利要求1所述的医疗数据处理方法,其特征在于,所述医疗数据处理方法还包括:
对历史医疗数据进行分词得到多个分词结果;
对各所述分词结果进行处理得到多个第一词向量,并利用所述多个第一词向量对连体神经网络进行训练得到所述分类模型。
3.根据权利要求2所述的医疗数据处理方法,其特征在于,所述利用所述多个第一词向量对连体神经网络进行训练得到所述分类模型,包括:
对各所述第一词向量进行切分得到第二词向量,并将所述第二词向量作为所述连体神经网络的第一输入;
将与所述第二词向量具有相同类别的现有词向量的平均值作为所述连体神经网络的第二输入;
基于所述第一输入以及第二输入对所述连体神经网络进行训练得到所述分类模型。
4.根据权利要求3所述的医疗数据处理方法,其特征在于,所述医疗数据处理方法还包括:
根据所述第一词向量构建正样本集以及负样本集;
其中,在所述正样本集中,所述第一输入中的第二词向量的类别属于所述第二输入中的所述现有词向量的平均值的类别;
在所述负样本集中,所述第一输入中的第二词向量的类别不属于所述第二输入中的所述现有词向量的平均值的类别。
5.根据权利要求1所述的医疗数据处理方法,其特征在于,利用预设规则对待处理医疗数据进行处理,得到多个候选医疗词包括:
依次利用不同预设长度的截取规则对所述待处理医疗数据进行截取得到多个截取结果;
根据所述多个截取结果得到多个所述候选医疗词。
6.根据权利要求1所述的医疗数据处理方法,其特征在于,根据所述输出结果的置信度判断各所述候选医疗词是否属于目标医疗词包括:
如果所述输出结果的置信度大于预设阈值,则判断该输出结果对应的候选医疗词为目标医疗词;
如果所述输出结果的置信度小于预设阈值,则对该输出结果对应的候选医疗词进行审查得到审查结果;
根据所述审查结果判断该输出结果对应的候选医疗词是否为目标医疗词。
7.根据权利要求2所述的医疗数据处理方法,其特征在于,在根据所述输出结果的置信度判断各所述候选医疗词是否属于目标医疗词之后,所述医疗数据处理方法还包括:
利用所述目标医疗词对所述预设分词器进行更新,并对所述目标医疗词进行存储。
8.一种医疗数据处理装置,其特征在于,包括:
第一处理模块,用于利用预设规则对待处理医疗数据进行处理,得到多个候选医疗词;
第二处理模块,用于将各所述候选医疗词输入至分类模型中得到多个输出结果;其中,所述分类模型是通过多个词向量对连体神经网络进行训练得到的;
判断模块,用于根据所述输出结果的置信度判断各所述候选医疗词是否属于目标医疗词。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的医疗数据处理方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任一项所述的医疗数据处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金色熊猫有限公司,未经金色熊猫有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910736586.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种预编码码本选择的方法及装置
- 下一篇:一种方便更换的新能源汽车阅读灯