[发明专利]一种基于KNN算法的远程医疗自动分诊方法在审
申请号: | 201810818355.X | 申请日: | 2018-07-24 |
公开(公告)号: | CN108986907A | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 翟运开;赵杰;石金铭;陈昊天;孙东旭;卢耀恩;陈保站;王振博 | 申请(专利权)人: | 郑州大学第一附属医院 |
主分类号: | G16H40/67 | 分类号: | G16H40/67;G16H10/60 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 张宇 |
地址: | 450001 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主诉 远程医疗 自动分诊 算法 文本预处理模块 相似度计算模块 数据挖掘技术 远程医疗服务 远程医疗系统 相似性度量 语义相似度 准确度 病历资料 匹配模块 算法实现 相似系数 用户提交 智能分诊 大数据 相似度 最近邻 数据库 维护 | ||
1.一种基于KNN算法的远程医疗自动分诊方法,其特征在于:包括如下步骤:
步骤1:建立分布式云服务器平台,建立若干远程医疗客户端,所有远程医疗客户端均通过互联网与分布式云服务器平台通信,在分布式云服务器平台中建立文本预处理模块、相似度计算模块和科室匹配模块;
步骤2:远程医疗客户端用于收集病人的主诉信息和电子病历,并将主诉信息和电子病历上传到云服务器平台;
步骤3:云服务器平台的文本预处理模块对病人的主诉信息和电子病历进行文本预处理,其步骤如下:
步骤A1:文本预处理模块设立主诉数据库和电子病历数据库,主诉数据库用于存储病人的主诉信息,电子病历数据库用于存储病人的电子病历;
步骤A2:文本预处理模块建立停用词表,在停用词表中预存停用词;
步骤A3:文本预处理模块将主诉信息和电子病历中的文本转化成为主诉文本向量:文本预处理模块根据停用词表将主诉信息和电子病历中的停用词删除,并利用正则表达式删除时间词,合并主诉信息和电子病历中的剩余文本,以字为单位构件文本向量,即,生成主诉文本向量;
步骤4:文本预处理模块将主诉文本向量上传给相似度计算模块,相似度计算模块对主诉文本向量进行相似度分析,其步骤如下:
步骤B1:在相似度计算模块中建立主诉数据集,主诉数据集中包含数个表达病症的字向量,以病症对应的科室为归类规则,对字向量进行归类,生成数个字向量集;
步骤B2:相似度计算模块获取文本预处理模块生成的主诉文本向量后,以字为最小单位,将主诉文本向量与主诉数据集中的字向量进行相似度对比;找出所有与主诉文本向量相似的字向量;
步骤5:根据KNN算法计算出候选科室列表,其步骤如下:
步骤C1:根据KNN算法,找出与主诉文本向量具有最多的相似度字向量的字向量集;
步骤C2:根据步骤C1得到的字向量集查找对应的科室,将该科室作为伪候选科室;
步骤C3:根据步骤C1和步骤C2的方法,选择出数个伪候选科室,并将所有伪候选科室按相似度字向量的数量进行顺序排序;
步骤C4:选择相似度字向量的数量最高的3个伪候选科室作为候选科室,并将这3个候选科室作为分诊结果输出;
步骤6:结束分诊。
2.如权利要求1所述的一种基于KNN算法的远程医疗自动分诊方法,其特征在于:在执行步骤B1时,每一个科室均提供一个科室背景资料,科室背景资料通过统计每个科室对应的病症主诉,由对应病症主诉集合关键词构建科室背景资料,在对主诉数据集中的表达病症的字向量进行归类时,采用相似度对比的方式,对所述表达病症的字向量与科室背景资料中的病症主诉集合关键词继续对比,将对比结果作为主诉数据集中的表达病症的字向量进行归类的依据。
3.如权利要求1所述的一种基于KNN算法的远程医疗自动分诊方法,其特征在于:在执行步骤A3时,所述时间词为主诉信息中表达时间的词汇。
4.如权利要求1所述的一种基于KNN算法的远程医疗自动分诊方法,其特征在于:所述远程医疗客户端为电脑、远程医疗终端或挂号终端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学第一附属医院,未经郑州大学第一附属医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810818355.X/1.html,转载请声明来源钻瓜专利网。