[发明专利]中文电子病历命名实体抽取方法及系统有效
申请号: | 201910313195.8 | 申请日: | 2019-04-18 |
公开(公告)号: | CN110032739B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 江瑞;黄浩 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 曹素云;董永辉 |
地址: | 100084 北京市海淀区1*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种中文电子病历命名实体抽取方法及系统。该方法包括:通过字符嵌入层将输入语句中的每个字映射为一个向量;采用LSTM模型输入字符序列,获得隐表示向量;将每个字作为以该字为结尾的语义单位的最后一个字,进行语义分割,得到该字对应的所有网格编码;将每个字的所有网格编码进行线性组合,得到最后的每个字符的向量,其中,线性组合中的权重由自注意力机制给出;采用深度残差网络作为输出解码层,解码出命名实体链。本发明中文电子病历命名实体抽取方法及系统可以自动从中文电子病历中抽取各种医学命名实体,且提高了抽取效率,免去了病历结构化过程中人工消耗。 | ||
搜索关键词: | 中文 电子 病历 命名 实体 抽取 方法 系统 | ||
【主权项】:
1.一种中文电子病历命名实体抽取方法,其特征在于,该方法包括以下步骤:步骤一,通过字符嵌入层将输入语句中的每个字映射为一个向量;步骤二,采用LSTM模型输入字符序列,获得隐表示向量;将每个字作为以该字为结尾的语义单位的最后一个字,进行语义分割,得到该字对应的所有网格编码;将每个字的所有网格编码进行线性组合,得到最后的每个字符的向量,其中,线性组合中的权重由自注意力机制给出;步骤三,采用深度残差网络作为输出解码层,解码出命名实体链。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910313195.8/,转载请声明来源钻瓜专利网。