[发明专利]一种电子病历文本结构化方法在审
申请号: | 201610405133.6 | 申请日: | 2016-06-08 |
公开(公告)号: | CN106095913A | 公开(公告)日: | 2016-11-09 |
发明(设计)人: | 冯前进;蒋君;庞树茂 | 申请(专利权)人: | 广州同构医疗科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06Q50/24 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510063 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种电子病历文本结构化方法,包括以下步骤:S1、载入医学知识库;S2、读入电子病历文本;S3、利用正向最大匹配算法对短句进行分词,获取句子中的词语及其词性、相对位置关系;S4、判断短句中对疾病信息描述的语义正反;S5、提取疾病信息元素;S6、重复步骤S2至S5,直至获得电子病历中的全部感兴趣内容;S7、合并疾病信息元素的不同表达,根据医学同义词词库,将相同的疾病信息合并,去除冗余信息;S8、将疾病描述信息的元素以结构体/类的形式存储,完成结构化过程,能有效的从病历的描述性文本中提取疾病的相关信息,形成对疾病信息的结构化表达,从而对疾病的发病规律、确诊方式、治疗效果等进行深层探索。 | ||
搜索关键词: | 一种 电子 病历 文本 结构 方法 | ||
【主权项】:
一种电子病历文本结构化方法,其特征在于,包括以下步骤:S1、载入医学知识库;S2、读入电子病历文本,并依据医生病历书写的标点习惯进行断句,将病历文本划分为一系列短句;S3、利用正向最大匹配算法对短句进行分词,获取句子中的词语及其词性、相对位置关系;S4、判断短句中对疾病信息描述的语义正反:当短句中存在否定性修饰词且不存在否定性医学专业术语时,认为对疾病信息单元的描述是否定的;其他情况下,认为短句对疾病信息单元的描述是肯定的;S5、提取疾病信息元素:根据短句分词的词性标注结果及正反语义判断,提取疾病的信息元素,否定性术语词汇作为一个整体进行提取;S6、重复步骤S2至S5,直至获得电子病历中的全部感兴趣内容;S7、合并疾病信息元素的不同表达,根据医学同义词词库,将相同的疾病信息合并,去除冗余信息;S8、将疾病描述信息的元素以结构体/类的形式存储,完成结构化过程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州同构医疗科技有限公司,未经广州同构医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610405133.6/,转载请声明来源钻瓜专利网。