[发明专利]科室推荐方法、装置、电子设备及存储介质在审
申请号: | 202110429296.9 | 申请日: | 2021-04-21 |
公开(公告)号: | CN113111162A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 赵璐偲 | 申请(专利权)人: | 康键信息技术(深圳)有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/33;G06F40/295;G06F16/36;G16H40/20 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 科室 推荐 方法 装置 电子设备 存储 介质 | ||
1.一种科室推荐方法,其特征在于,所述方法包括:
对问诊文本中的问诊数据进行清洗,得到标准文本;
利用预训练完成的疾病实体识别模型识别所述标准文本中的疾病实体,并对识别的所述疾病实体构建实体关系图谱,根据所述实体关系图谱,从识别的所述疾病实体中筛选出满足预设条件的疾病实体,得到第一疾病实体;
利用预构建的疾病实体正则表达式从所述标准文本中筛选疾病实体,并计算筛选的所述疾病实体与预设的疾病实体字典库中疾病实体的匹配度,从筛选的所述疾病实体中选取所述匹配度大于预设阈值的疾病实体,得到第二疾病实体;
对所述第一疾病实体和所述第二疾病实体分别进行降维,将降维后的所述第一疾病实体和所述第二疾病实体汇总,得到目标疾病实体;
计算所述目标疾病实体与预构建的医疗科室库中科室的关联度,从所述医疗科室中选取所述关联度大于预设关联度的科室,得到目标科室。
2.如权利要求1所述的科室推荐方法,其特征在于,所述对所述问诊文本中的问诊数据进行清洗,得到标准文本,包括:
对所述问诊文本中的问诊数据进行去重操作,并检测去重后的所述问诊文本中是否存在数据缺失值;
若不存在数据缺失值,则将去重后的所述问诊文作为标准文本;
若存在数据缺失值,则对所述数据缺失值进行数据填充,得到标准文本。
3.如权利要求2所述的科室推荐方法,其特征在于,所述对所述问诊文本中的问诊数据进行去重操作,包括:
计算所述问诊文本中任意两个问诊数据的相似度;
若所述相似度大于预设相似度,则同时保留所述问诊文本中任意两个问诊数据;
若所述相似度不大于预设相似度,则删除所述问诊文本中任意两个问诊数据的一个问诊数据。
4.如权利要求1所述的科室推荐方法,其特征在于,所述利用预训练完成的疾病实体识别模型识别所述标准文本中的疾病实体,包括:
利用所述疾病实体识别模型中的编码层对所述标准样本中字符进行位置向量编码,生成字符向量;
利用所述疾病实体识别模型中的前馈注意力机制对所述字符向量进行特征序列提取,得到特征序列向量;
利用所述疾病实体识别模型中疾病实体识别模块的对所述特征序列向量进行疾病实体识别,得到疾病实体。
5.如权利要求4中所述的科室推荐方法,其特征在于,所述利用所述疾病实体识别模型中的前馈注意力机制对所述字符向量进行特征序列提取,得到特征序列向量,包括:
利用所述前馈注意力机制中的自注意力模块查询所述字符向量;
利用所述前馈注意力机制中的卷积模块对查询到的所述字符向量进行特征提取,得到特征字符向量;
利用所述前馈注意力机制中的编码器提取所述特征字符向量的信息序列,得到特征序列向量。
6.如权利要求1至5中任一项所述的科室推荐方法,其特征在于,所述对识别的所述疾病实体构建实体关系图谱,包括:
利用翻译模型对识别的所述疾病实体进行关系向量建模,得到所述实体关系图谱向量空间;
将所述实体关系图谱向量空间转换为可视化界面的实体关系图谱,得到所述实体关系图谱。
7.如权利要求1所述的科室推荐方法,其特征在于,所述计算筛选的所述疾病实体与预设的疾病实体字典库中疾病实体的匹配度,包括:
利用下述方法计算所述匹配度:
其中,T(x,y)表示匹配度,xi表示筛选的所述疾病实体中第i个疾病实体,yi表示疾病实体字典库中第i个疾病实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康键信息技术(深圳)有限公司,未经康键信息技术(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110429296.9/1.html,转载请声明来源钻瓜专利网。