[发明专利]一种基于半马尔可夫的联合识别和规范化中医症状名的方法有效

专利信息
申请号: 201910132720.6 申请日: 2019-02-22
公开(公告)号: CN110020428B 公开(公告)日: 2023-05-23
发明(设计)人: 王亚强;张馨羽;舒红平;唐聃 申请(专利权)人: 成都信息工程大学
主分类号: G06F40/295 分类号: G06F40/295
代理公司: 北京众合诚成知识产权代理有限公司 11246 代理人: 苗艳荣
地址: 610225 四川省成都*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于半马尔可夫的联合识别和规范化中医症状名的方法,该模型通过识别和规范化过程分别采用半马尔可夫条件随机场和最大熵模型建模,采用L‑BFGS优化算法完成参数训练,并利用动态规划算法完成序列预测,最终通过对两个过程地互相约束和补充达到全局优化的目的,使其能更准确的识别较好的组合型临床症状名,最后通过实验验证了模型的效果。
搜索关键词: 一种 基于 半马尔可夫 联合 识别 规范化 中医 症状 方法
【主权项】:
1.一种基于半马尔可夫的联合识别和规范化中医症状名的方法,其特征在于,对于待识别的中医临床记录x,构建一个识别和规范化联合模型,完成从x中识别所有症状名s并将它们规范化成对应的标准症状名y,包括以下操作:1)所构建的识别和规范化联合模型为:其中,P(s|x)为识别模型,完成从给定的中医临床记录x中识别所有包含的症状名s=<seg1,seg2,...,segp>;P(yk|segk,x)为规范化模型,完成将从x中识别出的每一个临床症状名segk规范为其对应的规范化症状名yk;2)采用半马尔可夫条件随机场来构建识别模型,给出识别模型的表达形式(3.3):其中,为归一化因子,ωm表示全局特征gm的权值,gm表示二值全局特征函数,m∈[1,K],K是全局特征gm的数量,x表示一条临床记录实例,|s|为从x中识别出的症状名的总数,uk vk sk与前文表示相同,s'表示所有对中医临床记录x的可能存在的分割形式;考虑每一个文字块的前缀信息,通过文字块sk与sk‑1联系文字块两两之间的状态标签的联系;当前字串组合是症状名时则标注为“B”,如果不是则标注为“O”;3)将式(3.2)中的规范化模型定义为一个多元回归问题,并用下式(3.4)表示:其中,为归一化因子,为中医临床症状名经过文本编辑操作后得到标准症状名的过程的形式化,其中yk为规范化症状名,从中医临床症状名segk到中医标准症状名yk的文本编辑操作有M种可能,fl(yk,segk,x)表示第l种可能的从中医临床症状名segk到中医标准症状名yk的文本编辑操作,为0时表示segk与yk之间不包含当前的编辑操作关系,为1时表明两者之间包含当前的文本编辑操作;yk'表示所有的可能的规范化症状名;4)将公式(3.3)和(3.4)带回(3.1)得到最终的模型表达式(3.5):其中,Θ表示所有的参数ωm和μl的集合,S为症状名块集合,Y为标准症状名集合,X为临床记录集合;根据给定训练数据集学习一组最优的参数Θ,并使得最终的中医症状名识别和规范化结果最优,其中N为训练数据集中包含的带标注的中医临床数据的数目。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程大学,未经成都信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910132720.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top