[发明专利]一种基于LSTM-CRF的中医临床医案症状命名实体抽取系统在审

专利信息
申请号: 202111279393.0 申请日: 2021-10-29
公开(公告)号: CN113962227A 公开(公告)日: 2022-01-21
发明(设计)人: 林丽开;李刚;丁海雁 申请(专利权)人: 南京医路云数字科技研究院有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06N3/04;G06F16/35
代理公司: 暂无信息 代理人: 暂无信息
地址: 210000 江苏省南京市江北新*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 lstm crf 中医 临床 医案 症状 命名 实体 抽取 系统
【权利要求书】:

1.一种基于LSTM-CRF的中医临床医案症状命名实体抽取系统,其特征在于:包括LSTM-CRF网络模型,所述LSTM-CRF网络模型包括输入层、特征提取层、LSTM层和CRF层;所述输入层用于获取中医临床医案症状的文本信息;所述特征提取层用于对输入的文本信息的每一个字进行特征提取,并制定特征模板;所述LSTM层用于自动提取文字的特征;所述CRF层用于文字级别的序列标注,生成最优标注序列。

2.根据权利要求1所述的一种基于LSTM-CRF的中医临床医案症状命名实体抽取系统,其特征在于:所述特征提取层提取的文字特征包括文字的字符特征、字性特征、偏旁部首特征以及字意特征,对输入文字信息的每一个字进行标注,生成单个字的输出特征,所有字的输出特征组成特征序列。

3.根据权利要求2所述的一种基于LSTM-CRF的中医临床医案症状命名实体抽取系统,其特征在于:所述特征提取层中,是依据中医临床医案症状类别标签和BMEWO标记法对输入的每一个字进行标注。

4.根据权利要求1所述的一种基于LSTM-CRF的中医临床医案症状命名实体抽取系统,其特征在于:所述特征提取层包括两个LSTM深度网络,且两个LSTM深度网络拼接成双向LSTM深度网络。

5.根据权利要求4所述的一种基于LSTM-CRF的中医临床医案症状命名实体抽取系统,其特征在于:所述双向LSTM深度网络包括输入门、忘记门和输出门,其中:

输入门,根据网络需要制定有用的信息输入,阻断无用的信息输入;

忘记门,选择有价值的信息保存在网络中;

输出门,控制序列输出对当前标注有用的信息,防止对当前标注无用的信息输出。

6.根据权利要求1所述的一种基于LSTM-CRF的中医临床医案症状命名实体抽取系统,其特征在于:所述序列标注包括如下步骤:

步骤一:对文字信息预处理进行词向量表征,将每一个字分解成若干个偏旁部首;

步骤二:将分解后的文字信息转换为字向量表示;

步骤三:采用双向LSTM深度网络对分解后的中医临床医案症状文字信息进行编码训练,提取每个字的特征,利用CRF对每个字进行标记。

7.根据权利要求6所述的一种基于LSTM-CRF的中医临床医案症状命名实体抽取系统,其特征在于:利用预设的One Hot或非线性PCA编码方式将分解后的每一个字转化为与之相对应的字向量。

8.根据权利要求7所述的一种基于LSTM-CRF的中医临床医案症状命名实体抽取系统,其特征在于:所述序列标注还包括:

步骤四:将标记分成可识别不同识别语料的不同标记,并划分为不同的训练集和测试集;

步骤五:将得到的训练集输入到LSTM-CRF模型中进行训练,得到具有中医临床医案症状命名实体的训练模型;

步骤六:利用步骤五中的训练模型去训练步骤四中的测试集,进行命名实体抽取识别,得到抽取识别结果。

9.根据权利要求8所述的一种基于LSTM-CRF的中医临床医案症状命名实体抽取系统,其特征在于:所述序列标注还包括:

步骤七:分别计算抽取识别结果在训练集和测试集上的精确率、召回率和F1值,并将精确率、召回率和F1值进行对比。

10.根据权利要求9所述的一种基于LSTM-CRF的中医临床医案症状命名实体抽取系统,其特征在于:训练集和测试集的比例为20∶1。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京医路云数字科技研究院有限公司,未经南京医路云数字科技研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111279393.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top