[发明专利]一种数据处理方法及装置在审
申请号: | 202010559649.2 | 申请日: | 2020-06-18 |
公开(公告)号: | CN111724873A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 孟庆伟;胡可云;陈联忠 | 申请(专利权)人: | 北京嘉和海森健康科技有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H50/70;G06F40/289 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 林哲生 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
本发明公开了一种数据处理方法及装置,获取待处理病历数据;对待处理病历数据进行预处理,得到第一新信息和第二信息;将所述第一信息输入至预设疾病特征库进行信息识别,获得第一关联信息;将所述第二信息输入至预设鉴别信息库进行信息识别,获得第二关联信息;根据第一关联信息和第二关联信息,生成目标信息。在本发明中第一信息包括患者病历特点的信息,第二信息包括患者疾病信息,通过对样本病历数据进行自然语言处理可以得到疾病特征库和鉴别信息库,并通过这些数据库对获得第一信息和第二信息进行自动识别和处理,提升针对病历数据的分析效率和分析准确性的目的。
技术领域
本发明涉及信息处理技术领域,特别是涉及一种数据处理方法及装置。
背景技术
病历是医务人员对患者疾病的发生、发展、转归,进行检查、诊断、治疗等医疗活动过程的记录。随着技术的发展,目前通过电子病历来记录患者对应的诊疗信息。其中,首次病程记录为患者入院后8小时内需完成的病程记录,一般包括病历特点、疾病与鉴别疾病、诊疗计划等章节。
医生可以根据电子病历数据中记录的首次病程记录数据先分析获得关联信息,然后根据该关联信息确定对患者的进一步检查,通过检查结果来得到最终的诊断信息。在现有技术中需要通过将电子病历数据与鉴别诊断库中的信息进行比对,基于比对结果获得对应的关联信息。现有的鉴别诊断库中的信息均来自医学教科书等文献,由于文献种类较广可能会存在记录不全面的问题,另一方面由于不同的医生对鉴别诊断库中信息的理解不同,使得对鉴别诊断库中信息的利用率较低,这些都会造成针对病历数据的分析效率低、准确度低的问题。
发明内容
针对于上述问题,本发明提供一种数据处理方法及装置,实现了能够自动分析获得病历数据的关联信息,提升分析效率和准确性的目的。
为了实现上述目的,本发明提供了如下技术方案:
一种数据处理方法,所述方法包括:
获取待处理病历数据;
对所述待处理病历数据进行预处理,得到第一信息和第二信息,其中,所述第一信息包括患者病历特点的信息,第二信息包括患者疾病信息;
将所述第一信息输入至预设疾病特征库进行信息识别,获得第一关联信息,所述预设疾病特征库表征对样本病历数据的结构化数据进行特征处理得到的数据库,所述结构化数据表征通过对所述样本病历数据进行关联处理及自然语言处理得到的数据;
将所述第二信息输入至预设鉴别信息库进行信息识别,获得第二关联信息,所述预设鉴别信息库表征对所述结构化数据进行疾病与鉴别疾病的聚合处理得到的数据库;
根据所述第一关联信息和所述第二关联信息,生成目标信息。
可选地,所述方法还包括:
基于样本病历数据创建疾病特征库,包括:
对样本病历数据中的首次病程记录信息进行信息提取,得到疾病与鉴别疾病的章节信息;
将所述疾病与鉴别疾病的章节信息输入至预设分词模型,使得所述预设分词模型输出具有层次的结构化数据;
基于所述结构化数据,生成疾病特征库。
可选地,所述方法还包括:
基于样本病历数据创建鉴别信息库,包括:
对所述结构化数据进行信息提取,得到鉴别疾病信息;
通过疾病与鉴别疾病之间的对应关系,对所述鉴别疾病信息进行聚合处理,得到鉴别信息库。
可选地,所述方法还包括:
基于样本病历数据创建分词模型,包括:
对样本病历数据进行信息提取,得到层次信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘉和海森健康科技有限公司,未经北京嘉和海森健康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010559649.2/2.html,转载请声明来源钻瓜专利网。