[发明专利]基于信息抽取和实体归一的医学相似病例推荐方法和系统有效
申请号: | 202310836858.0 | 申请日: | 2023-07-10 |
公开(公告)号: | CN116564539B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 刘硕;杨雅婷;白焜太;宋佳祥;许娟;史文钊 | 申请(专利权)人: | 神州医疗科技股份有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06F40/216;G06F40/295;G16H10/60;G16H50/20;G06F16/33;G06F16/35;G06F18/22 |
代理公司: | 北京星通盈泰知识产权代理有限公司 11952 | 代理人: | 黄正奇 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 信息 抽取 实体 医学 相似 病例 推荐 方法 系统 | ||
本发明公开了基于信息抽取和实体归一的医学相似病例推荐方法和系统,通过对病情描述文本进行实体分割,获取其中的疾病术语信息,然后从历史病例数据库中获取历史病例信息并进行文本分割信息抽取,得到历史病例信息中的疾病关键词,最后将所述疾病术语信息和所述疾病关键词进行归一化处理,根据处理结果筛选出包含疾病术语信息的历史病例进行相似病例推荐,减轻了性能要求,降低推荐耗时,更有利于诊断的高效进行,从而快速准确地分析出高相似度的病例向医生进行推荐。
技术领域
本发明属于医学数据分析领域,具体涉及基于信息抽取和实体归一的医学相似病例推荐方法和系统。
背景技术
目前临床辅助诊疗系统的重要一环是辅助诊断,辅助诊断系统中,基于当前患者信息进行相似的病历推荐给医生,是辅助医生诊断的有效手段,使得当前医生在诊断患者当前病情信息时有参考信息,所以医生在为患者进行诊断治疗的过程中,相似病例及其相似病例的疗法,对患者的诊断治疗具有不可或缺的作用,是医生为患者快速确诊,查找病因,临床医治的重要参考。
现有技术中,相似病例的获取,一般通过患者的病例信息对数据库中的病例数据进行匹配。所以现有技术中的病例数据的比较是全量和实时的比较,对性能要求高,耗时过长,不利于诊断的高效进行,所以现有的病例获取无法快速准确地分析出高相似度的病例向医生进行推荐。
发明内容
针对上述现有技术的不足,本申请提供于信息抽取和实体归一的医学相似病例推荐方法和系统。
第一方面本申请提出了基于信息抽取和实体归一的医学相似病例推荐方法,包括以下步骤:
从接诊室的病例数据录入终端中获取接诊患者的病情描述文本;
对所述病情描述文本进行实体分割,获取病情描述文本中的疾病术语信息;
从历史病例数据库中获取历史病例信息并进行文本分割信息抽取,得到历史病例信息中的疾病关键词;
将所述疾病术语信息和所述疾病关键词进行归一化处理,根据处理结果筛选出包含疾病术语信息的历史病例进行相似病例推荐。
在一些实施例中,所述对所述病情描述文本进行实体分割,获取病情描述文本中的疾病术语信息,包括:
计算所述病情描述文本中疾病术语的TF值,计算公式为:
其中,表示当前疾病术语在病情描述文本中出现的次数,i表示第i个疾病术语,j表示第j 个病情描述文本,k表示疾病术语总数,表示当前疾病术语在病情描述文本中出现的频率;
计算所述病情描述文本中疾病术语的IDF值,计算公式为:
其中,表示所有病情描述文本的数量,表示包含疾病术语的病情描述文本数量,表示指定的一个疾病术语;
根据TF-IDF模型计算得到病情描述文本中每个指定的疾病术语的权重,设定权重阈值,筛选出高于所述权重阈值的疾病术语作为病情表述文本中的疾病术语信息。
在一些实施例中,所述从历史病例数据库中获取历史病例信息并进行文本分割信息抽取,得到历史病例信息中的疾病关键词,包括:
将所述历史病例信息输入第一bert模型中,得到历史病例信息中每个字符的第一向量表示;
结合交叉熵损失函数和第一线性层公式对每个字符向量进行实体识别分类预测,得到实体识别分类预测结果;
将所述实体识别分类预测经过softmax函数得到0~1之间的映射数值,根据所述映射数值和对应词表得到疾病关键词。
在一些实施例中,所述结合交叉熵损失函数和第一线性层公式对每个字符向量进行实体识别分类预测,得到实体识别分类预测结果;所述交叉熵损失函数为:
其中,p(x)表示当前输入的真实标签label,q(x)表示模型对每个标签label的预测值;表示p和q之间的交叉熵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于神州医疗科技股份有限公司,未经神州医疗科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310836858.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置