[发明专利]一种将病历文本从自然语言转换为结构化元数据的方法有效
申请号: | 201811511195.0 | 申请日: | 2018-12-11 |
公开(公告)号: | CN109710670B | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 曾凡;邰海军;黄锦;柯钦瑜;黄勇;段惠峰 | 申请(专利权)人: | 萱闱(河南)生命科学研究院有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G16H10/60 |
代理公司: | 郑州中原专利事务所有限公司 41109 | 代理人: | 李想 |
地址: | 450000 河南省郑州市中原区华山路220号4号楼一*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种将病历文本从自然语言转换为结构化元数据的方法,包括以下步骤:步骤一:从历史病例报告中提取该文本格式中具体器官、部位和术式的特征值文本,并对其进行特征值分析,得出特征字典;步骤二:从医院导出需要分析的历史检测报告,合并成为一个待处理数据集;步骤三:遍历该数据集患者病例,并根据特征值字典分词,截取该器官、部位或术式的说明;步骤四:将该部位截取的数据内容持久化至结构化的数据库中。本发明利用历史病例,使用遍历算法,降低了使用成本,免去了训练集的生成步骤,转换后的结构化病例可以方便的对不同器官和部位的病变进行统计、分析和查找,方便医生进行医学研究、编写论文和教学。 | ||
搜索关键词: | 一种 病历 文本 自然语言 转换 结构 数据 方法 | ||
【主权项】:
1.一种将病历文本从自然语言转换为结构化元数据的方法,其特征在于,包括以下步骤:步骤一:从历史病例报告中提取该文本格式中具体器官、部位和术式的特征值文本,并对其进行特征值分析,得出特征字典;步骤二:从医院导出需要分析的历史检测报告,合并成为一个待处理数据集;步骤三:遍历该数据集患者病例,并根据特征值字典分词,截取该器官、部位或术式的说明;步骤四:将该部位截取的数据内容持久化至结构化的数据库中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于萱闱(河南)生命科学研究院有限公司,未经萱闱(河南)生命科学研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811511195.0/,转载请声明来源钻瓜专利网。