[发明专利]症状数据处理方法、装置、计算机设备及存储介质在审
申请号: | 202010921651.X | 申请日: | 2020-09-04 |
公开(公告)号: | CN112016295A | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 朱昭苇;孙行智;胡岗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F16/35;G06N3/04;G06N3/08;G16H50/20 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 詹建新 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 症状 数据处理 方法 装置 计算机 设备 存储 介质 | ||
1.一种症状数据处理方法,其特征在于,包括:
获取症状数据;
通过预设BERT编码器将所述症状数据处理为表征向量,所述表征向量基于所述症状数据中的症状特征数据而生成;所述症状特征数据包括症状名称和症状属性;所述预设BERT编码器经预训练任务训练后获得;所述预训练任务用于确定所述表征向量与所述症状特征数据之间的关联关系;
将所述表征向量输入预设TextCNN模型,获取所述预设TextCNN模型输出的分类结果。
2.如权利要求1所述的症状数据处理方法,其特征在于,所述获取症状数据,包括:
获取第一症状数据;
根据所述第一症状数据输出相关症状提示;
基于所述相关症状提示获取第二症状数据;
在确定症状数据收集完毕后,完成所述症状数据的获取,所述症状数据包括所述第一症状数据和所述第二症状数据。
3.如权利要求1所述的症状数据处理方法,其特征在于,所述通过预设BERT编码器将所述症状数据处理为表征向量,所述表征向量基于症状名称和症状属性而生成之前,还包括:
建立预训练任务,使用word2vec模型将症状样本处理为若干个词向量,所述词向量包括基于症状名称生成的第一词向量,基于症状属性生成的第二词向量;
将所述若干个词向量输入初始BERT网络模型,获取所述初始BERT网络模型输出的训练表征向量;
根据所述训练表征向量计算所述初始BERT网络模型的损失值;
若所述损失值处于预设范围之外,调整所述初始BERT网络模型的模型参数,并重新计算所述症状样本的训练表征向量,以计算所述初始BERT网络模型的损失值;
若所述损失值处于预设范围之内,则所述预训练任务训练完毕,训练完毕后的所述初始BERT网络模型即为所述预设BERT编码器。
4.如权利要求1所述的症状数据处理方法,其特征在于,所述获取症状数据之后,还包括:
根据所述症状数据生成句向量;
将所述句向量与本地病历库的病历句向量比较,计算余弦相似度;
根据所述余弦相似度选取指定个数的匹配病历;
获取所述匹配病历所属的就诊科室,将出现频次最高的就诊科室确定为推荐科室。
5.如权利要求4所述的症状数据处理方法,其特征在于,所述将所述句向量与本地病历库的病历句向量比较,计算余弦相似度之前,还包括:
获取本地病历库的病历数据;
使用所述预设BERT编码器处理所述病历数据,生成症状词向量查询词表,所述症状词向量查询词表包括每一症状的症状词向量;
计算所述症状词向量的TF-IDF值;
根据所述症状词向量和所述TF-IDF值生成每份病历的病历句向量。
6.一种症状数据处理装置,其特征在于,包括:
获取模块,用于获取症状数据;
数据处理模块,用于通过预设BERT编码器将所述症状数据处理为表征向量,所述表征向量基于所述症状数据中的症状名称及其属性而生成;所述预设BERT编码器经预训练任务训练后获得;所述预训练任务用于确定所述表征向量与所述症状名称和症状属性之间的关联关系;
数据输出模块,用于将所述表征向量输入预设TextCNN模型,获取所述预设TextCNN模型输出的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010921651.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种物联网控制智能家居用消毒柜
- 下一篇:一种板材封边机