[发明专利]一种基于循环神经网络的诊疗项目预测方法在审
申请号: | 202011007493.3 | 申请日: | 2020-09-23 |
公开(公告)号: | CN114255865A | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 赵奎;闫玉芳;曹吉龙;马慧敏;魏景峰;张帅康;高天;董莉颖 | 申请(专利权)人: | 中国科学院沈阳计算技术研究所有限公司 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G06N3/04;G06N3/08 |
代理公司: | 沈阳科苑专利商标代理有限公司 21002 | 代理人: | 王倩 |
地址: | 110168 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 循环 神经网络 诊疗 项目 预测 方法 | ||
1.一种基于循环神经网络的诊疗项目预测方法,其特征在于,包括以下步骤:
获取诊疗记录数据,并对诊疗记录数据进行清洗;
将清洗后的诊疗记录数据转换成向量形式的诊疗记录时间序列,并将该序列分为训练集、验证集和测试集;
使用聚类算法,对诊疗记录时间序列进行处理,得到规范诊疗模式序列;
使用诊疗记录时间序列构建诊疗项目预测模型;
计算待检测诊疗记录时间序列与规范诊疗模式序列的相似度,若相似度大于阈值,则将待检测诊疗记录时间序列输入诊疗项目预测模型,得到最后一个时间间隔内诊疗项目发生的概率,否则,不对该待检测诊疗记录时间序列进行处理。
2.根据权利要求1所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述诊疗记录数据包括:诊断结果、医嘱、用药情况、检查项目。
3.根据权利要求1所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述对诊疗记录数据进行清洗具体为:
删除与预测任务无关的字段,采用设定的标准值填充或者删除的方式处理诊疗记录数据中的缺失值和噪声。
4.根据权利要求1所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述将清洗后的诊疗记录数据转换成向量形式的诊疗记录时间序列,包括以下步骤:
将清洗后的诊疗记录数据按照设定的时间间隔转化成诊疗记录序列;
统计诊疗记录序列中所有诊疗记录的数量,以独热码的形式对每一个诊疗记录进行编码,将每条诊疗记录序列的每个时间间隔内的诊疗记录的编码相加取平均得到诊疗记录集合的编码;
用skip-gram算法将诊疗记录集合的编码转化成向量表示,得到向量形式的诊疗记录序列;
将每一条向量形式的诊疗记录序列中的最后一个时间间隔的诊疗记录集合向量,作为该条数据的预测标签,并将该诊疗记录集合向量从向量形式的诊疗记录序列中删除,得到已标注的向量形式的诊疗记录时间序列即去掉最后一个时间间隔的诊疗记录集合向量的数据。
5.根据权利要求1所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述使用聚类算法,对诊疗记录时间序列进行处理,得到规范诊疗模式序列,包括以下步骤:
1)将所有向量形式的诊疗记录时间序列初始化为一个簇并加入簇表;
2)在簇表中选取一个总体相似度最低的簇C,利用K-means方法将簇C分为C1和C2加入簇表中;
3)重复步骤2),直到产生设定的K个簇时停止,将K个簇的质心作为规范诊疗模式序列。
6.根据权利要求5所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,用向量之间的余弦相似度来表征簇的整体相似度,余弦相似度的函数表达式为:
式中X是簇Ci中的样本即一条向量形式的诊疗记录序列,ci是簇Ci的质心,P是和样本X同维度的全1列向量,⊙表示矩阵的哈达马乘积,×表示矩阵乘法;
样本X和质心ci之间的距离为:
式中cosX,ci[j][j]表示余弦相似度结果矩阵cosX,ci中的第j行第j列,即第j个时间间隔的余弦相似度,n表示时间间隔总数;
簇总体相似度表达式为:
式中k是当前簇的个数,SSE的值越大说明相似度越低。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院沈阳计算技术研究所有限公司,未经中国科学院沈阳计算技术研究所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011007493.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:车辆的控制方法、装置及车辆
- 下一篇:充电管理电路和可充电电子设备