[发明专利]一种基于KNN算法的远程医疗自动分诊方法在审
申请号: | 201810818355.X | 申请日: | 2018-07-24 |
公开(公告)号: | CN108986907A | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 翟运开;赵杰;石金铭;陈昊天;孙东旭;卢耀恩;陈保站;王振博 | 申请(专利权)人: | 郑州大学第一附属医院 |
主分类号: | G16H40/67 | 分类号: | G16H40/67;G16H10/60 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 张宇 |
地址: | 450001 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于KNN算法的远程医疗自动分诊方法,属于大数据技术领域,包括建立文本预处理模块、相似度计算模块和科室匹配模块,采用Jaccard相似系数作为KNN算法中相似性度量算法,并采用KNN算法进行分诊,解决了远程医疗系统中多病症快速准确分诊的技术问题,本发明利用数据挖掘技术中的K最近邻(kNN,k‑Nearest Neighbor)算法,根据提交的患者主诉,计算患者主诉与数据库中其他主诉的语义相似度,实现自动分诊,针对远程医疗服务中的分诊需求,获取患者主诉与就诊科室数据,通过计算不同患者主诉之间的相似度,基于KNN分类算法实现了智能分诊,在用户提交远程医疗病历资料后,引导用户进行正确就诊,提高了分诊的速度和准确度,降低了维护难度。 | ||
搜索关键词: | 主诉 远程医疗 自动分诊 算法 文本预处理模块 相似度计算模块 数据挖掘技术 远程医疗服务 远程医疗系统 相似性度量 语义相似度 准确度 病历资料 匹配模块 算法实现 相似系数 用户提交 智能分诊 大数据 相似度 最近邻 数据库 维护 | ||
【主权项】:
1.一种基于KNN算法的远程医疗自动分诊方法,其特征在于:包括如下步骤:步骤1:建立分布式云服务器平台,建立若干远程医疗客户端,所有远程医疗客户端均通过互联网与分布式云服务器平台通信,在分布式云服务器平台中建立文本预处理模块、相似度计算模块和科室匹配模块;步骤2:远程医疗客户端用于收集病人的主诉信息和电子病历,并将主诉信息和电子病历上传到云服务器平台;步骤3:云服务器平台的文本预处理模块对病人的主诉信息和电子病历进行文本预处理,其步骤如下:步骤A1:文本预处理模块设立主诉数据库和电子病历数据库,主诉数据库用于存储病人的主诉信息,电子病历数据库用于存储病人的电子病历;步骤A2:文本预处理模块建立停用词表,在停用词表中预存停用词;步骤A3:文本预处理模块将主诉信息和电子病历中的文本转化成为主诉文本向量:文本预处理模块根据停用词表将主诉信息和电子病历中的停用词删除,并利用正则表达式删除时间词,合并主诉信息和电子病历中的剩余文本,以字为单位构件文本向量,即,生成主诉文本向量;步骤4:文本预处理模块将主诉文本向量上传给相似度计算模块,相似度计算模块对主诉文本向量进行相似度分析,其步骤如下:步骤B1:在相似度计算模块中建立主诉数据集,主诉数据集中包含数个表达病症的字向量,以病症对应的科室为归类规则,对字向量进行归类,生成数个字向量集;步骤B2:相似度计算模块获取文本预处理模块生成的主诉文本向量后,以字为最小单位,将主诉文本向量与主诉数据集中的字向量进行相似度对比;找出所有与主诉文本向量相似的字向量;步骤5:根据KNN算法计算出候选科室列表,其步骤如下:步骤C1:根据KNN算法,找出与主诉文本向量具有最多的相似度字向量的字向量集;步骤C2:根据步骤C1得到的字向量集查找对应的科室,将该科室作为伪候选科室;步骤C3:根据步骤C1和步骤C2的方法,选择出数个伪候选科室,并将所有伪候选科室按相似度字向量的数量进行顺序排序;步骤C4:选择相似度字向量的数量最高的3个伪候选科室作为候选科室,并将这3个候选科室作为分诊结果输出;步骤6:结束分诊。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学第一附属医院,未经郑州大学第一附属医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810818355.X/,转载请声明来源钻瓜专利网。