[发明专利]一种基于中文医疗主诉分析的临床数据组分类方法在审
申请号: | 201910814991.X | 申请日: | 2019-08-30 |
公开(公告)号: | CN110517787A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | 曹梦莉;王国超 | 申请(专利权)人: | 山东健康医疗大数据有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H80/00;G06F16/35;G06F17/27;G06N20/00 |
代理公司: | 37100 济南信达专利事务所有限公司 | 代理人: | 郗艳荣<国际申请>=<国际公布>=<进入 |
地址: | 250117 山东省济南市槐*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据组 主诉 临床数据 组分类 检查数据 临床检验 使用机器 数据中心 医生录入 分析 中文 医疗 知识库 医院信息系统 分析处理 工作效率 获取数据 精准分类 数据分类 数据类别 数据模型 学习算法 重要意义 挖掘 数据源 构建 算法 隐含 医生 学习 | ||
本发明特别涉及一种基于中文医疗主诉分析的临床数据组分类方法。该基于中文医疗主诉分析的临床数据组分类方法,使用机器学习算法对各种临床检验检查数据和医生录入的主诉项组成的数据组进行分析挖掘,获取数据组所隐含的信息和知识;根据医院信息系统提供的数据源进行分析处理,得到数据组的数据分类;将数据组存入临床数据中心相关知识库对应的数据类别即可。该基于中文医疗主诉分析的临床数据组分类方法,通过使用机器学习相关算法建立数据模型,对各种临床检验检查数据和医生录入的主诉项组成的数据组进行分析挖掘,实现了对数据组的精准分类,不仅能够大大提高医生的工作效率,还对构建院内小型、微型临床数据中心具有重要意义。
技术领域
本发明涉及机器学习算法与数据挖掘技术领域,特别涉及一种基于中文医疗主诉分析的临床数据组分类方法。
背景技术
不同的医院、医院的不同等级,院内信息化程度参差不齐,在信息化程度不高的医院内部,各个业务系统存在数据孤岛,院内各系统之间,区域内医院和医院之间,医院和社会公众之间均存在不同程度的数据壁垒。
随着大数据技术的不断发展,在政策和技术的双重推动下,医院有强烈的意愿消除内部的数据壁垒,建立微型、小型医院临床数据中心,对数据的互联互通、医生的科研需求、院内的疾病判断、减少医生误诊率等方面将会有重要的意义。
医生在诊疗过程中,需要很多相关信息的辅助,最重要的信息来源是患者的各种临床检验检查数据组成的数据组。这些检验检测数据组成的数据组,汇入到疾病数据库之后,能够形成疾病辅助决策支持,对医生的工作进一步形成指导,从而准确判断疾病,给出诊疗方案,减少技术上的失误。因此,若能建立数据模型,对各种临床检验检查数据组成的数据组进行分析挖掘,实现对数据组的精准分类,将会大大提高医生的工作效率,对构建院内小型、微型临床数据中心具有重要意义。
基于上述情况,本发明提出了一种基于中文医疗主诉分析的临床数据组分类方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的基于中文医疗主诉分析的临床数据组分类方法。
本发明是通过如下技术方案实现的:
一种基于中文医疗主诉分析的临床数据组分类方法,其特征在于:包括以下步骤:
第一步,使用机器学习算法对各种临床检验检查数据和医生录入的主诉项组成的数据组进行分析挖掘,获取数据组所隐含的信息和知识;
第二步,根据医院信息系统提供的数据源对医生录入的主诉项内容进行分析处理,结合获取到的数据组隐含的信息和知识,得到数据组的数据分类;
第三步,将数据组存入临床数据中心相关知识库对应的数据类别即可。
所述第一步中,所述使用机器学习算法对各种临床检验检查数据组成的数据组进行分析挖掘,包括中文文本预处理、特征提取、数据建模和知识发现。
所述中文文本预处理包括文本数据清洗、词切分和数据映射。
所述数据清洗是指处理缺失数据与异常值,并剔除掉原始数据中与数据建模无关的数据。
所述词切分是指使用用户自定义的分词词典将各种临床检验检查数据和医生录入的主诉项分别进行分词;所述用户自定义的分词词典采用主诉相关医学词典,并在词切分时加载使用。
所述数据映射是指构建检查及数据分类标准映射表,并使用标准映射表分别对各种临床检验检查数据和医生录入的主诉项进行标准化处理。例:高血压三级(XXX)映射为高血压三级。
所述特征提取包括以下两部分:
第一,加载用户自定义词典对医生录入的主诉项内容进行分词,转换为词向量后提取主诉特征词后,对主诉特征词进行编码转换;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东健康医疗大数据有限公司,未经山东健康医疗大数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910814991.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:挖掘癌症关键生物标记物的方法及装置
- 下一篇:一种中文电子病历信息抽取的方法