[发明专利]基于信息抽取和实体归一的医学相似病例推荐方法和系统有效
申请号: | 202310836858.0 | 申请日: | 2023-07-10 |
公开(公告)号: | CN116564539B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 刘硕;杨雅婷;白焜太;宋佳祥;许娟;史文钊 | 申请(专利权)人: | 神州医疗科技股份有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06F40/216;G06F40/295;G16H10/60;G16H50/20;G06F16/33;G06F16/35;G06F18/22 |
代理公司: | 北京星通盈泰知识产权代理有限公司 11952 | 代理人: | 黄正奇 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 信息 抽取 实体 医学 相似 病例 推荐 方法 系统 | ||
1.基于信息抽取和实体归一的医学相似病例推荐方法,其特征在于:包括以下步骤:
从接诊室的病例数据录入终端中获取接诊患者的病情描述文本;
对所述病情描述文本进行实体分割,获取病情描述文本中的疾病术语信息;
从历史病例数据库中获取历史病例信息并进行文本分割信息抽取,得到历史病例信息中的疾病关键词;
将所述疾病术语信息和所述疾病关键词进行归一化处理,根据处理结果筛选出包含疾病术语信息的历史病例进行相似病例推荐。
2.根据权利要求1所述的方法,其特征在于:所述对所述病情描述文本进行实体分割,获取病情描述文本中的疾病术语信息,包括:
计算所述病情描述文本中疾病术语的TF值,计算公式为:
其中,表示当前疾病术语在病情描述文本中出现的次数,i表示第i个疾病术语,j表示第j 个病情描述文本,k表示疾病术语总数,表示当前疾病术语在病情描述文本中出现的频率;
计算所述病情描述文本中疾病术语的IDF值,计算公式为:
其中,表示所有病情描述文本的数量,表示包含疾病术语的病情描述文本数量,表示指定的一个疾病术语;
根据TF-IDF模型计算得到病情描述文本中每个指定的疾病术语的权重,设定权重阈值,筛选出高于所述权重阈值的疾病术语作为病情表述文本中的疾病术语信息。
3.根据权利要求1所述的方法,其特征在于:所述从历史病例数据库中获取历史病例信息并进行文本分割信息抽取,得到历史病例信息中的疾病关键词,包括:
将所述历史病例信息输入第一bert模型中,得到历史病例信息中每个字符的第一向量表示;
结合交叉熵损失函数和第一线性层公式对每个字符向量进行实体识别分类预测,得到实体识别分类预测结果;
将所述实体识别分类预测经过softmax函数得到0~1之间的映射数值,根据所述映射数值和对应词表得到疾病关键词。
4.根据权利要求3所述的方法,其特征在于:所述结合交叉熵损失函数和第一线性层公式对每个字符向量进行实体识别分类预测,得到实体识别分类预测结果;所述交叉熵损失函数为:
其中,p(x)表示当前输入的真实标签label,q(x)表示模型对每个标签label的预测值;表示p和q之间的交叉熵;
所述第一线性层公式为:
其中x为历史病例信息中的每个字符经过第一bert模型获得的768维度的向量表示,A为第一线性层的权重矩阵,b为第一线性层的偏置矩阵,y为经过第一线性层之后得到的结果。
5.根据权利要求4所述的方法,其特征在于:所述将所述实体识别分类预测经过softmax函数得到0~1之间的映射数值,根据所述映射数值和对应词表得到疾病关键词,所述softmax函数公式为:
其中,表示的指数函数,n表示输出层共有n个神经元,表示计算的当前输入字符,表示第k个神经元的输出,所以,softmax函数的分子是输入字符的指数函数,分母是所有输入信号的指数函数的和。
6.根据权利要求5所述的方法,其特征在于:所述将所述疾病术语信息和所述疾病关键词进行归一化处理,包括:
对所述疾病术语信息和来自所述疾病关键词进行拼接,拼接格式为:cls+疾病术语信息+sep+疾病关键词+sep,cls和sep是英文字符,cls用于提示模型开头,sep用于提示模型中间和结尾,然后输入第二bert模型中得到拼接结果的第二向量表示;
将拼接结果的第二向量表示经过第二线性层进行0,1分类,其中0代表不是指代的同一内容,1代表指代的是同一内容,通过分类结果进行判断是否指代相同内容的二分类任务;
基于判断结果完成所述疾病术语信息和所述疾病关键词的归一化处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于神州医疗科技股份有限公司,未经神州医疗科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310836858.0/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置