[发明专利]医疗文本分类方法及装置、存储介质、电子设备有效
申请号: | 202010194565.3 | 申请日: | 2020-03-19 |
公开(公告)号: | CN111403028B | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 王磊;张恒 | 申请(专利权)人: | 医渡云(北京)技术有限公司 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06F16/33;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 文本 分类 方法 装置 存储 介质 电子设备 | ||
1.一种医疗文本分类方法,应用于肿瘤分期管理,其特征在于,包括:
将待分类医疗文本输入至预设的词向量生成模型中得到多个词向量,并根据所述待分类医疗文本的路径得到多个路径向量;根据各所述词向量以及各所述路径向量得到待分类向量序列,并利用预设的医疗分类模型中包括的共享特征编码器对所述待分类向量序列进行编码,得到多个待处理隐含向量,并利用预设的医疗分类模型中包括的注意力矩阵模块对各所述待处理隐含向量与预设的由多个医学特征属性组成的特征矩阵中的每一行进行点乘运算,得到各所述待处理隐含向量与各所述医学特征属性之间的相关度;其中,所述特征矩阵中的每一行对应每一个所述医学特征属性的向量;
利用预设的医疗分类模型中包括的注意力矩阵模块对各所述待处理隐含向量与各所述医学特征属性之间的相关度进行归一化处理,并根据归一化处理后的相关度得到各所述医学特征属性针对所述待分类医疗文本的注意力值;
根据各所述医学特征属性针对所述待分类医疗文本的注意力值对所述待分类医疗文本进行分类;
所述医疗文本分类方法还包括:
对历史医疗文本进行编码得到多个标准隐含向量,并根据各所述标准隐含向量以及所述由多个医学特征属性组成的特征矩阵,计算各所述标准隐含向量与各所述医学特征属性之间的相关度;
根据各所述标准隐含向量与各所述医学特征属性之间的相关度,计算各所述医学特征属性针对所述历史医疗文本的注意力值;
根据各所述医学特征属性针对所述历史医疗文本的注意力值计算各所述医学特征属性的第一预测分类结果,并根据各所述医学特征属性针对所述历史医疗文本的注意力值对所述历史医疗文本进行分类得到第二预测分类结果;
计算所述第一预测分类结果与所述医学特征属性的第一目标分类结果的第一损失函数,以及第二预测分类结果与所述历史医疗文本的第二目标分类结果的第二损失函数;
利用所述第一损失函数以及第二损失构建目标损失函数,并利用所述目标损失函数对初始网络模型进行机器学习,得到所述预设的医疗分类模型。
2.根据权利要求1所述的医疗文本分类方法,其特征在于,在对待分类医疗文本进行编码得到多个待处理隐含向量之前,所述医疗文本分类方法还包括:
获取包括多个不同路径的待处理医疗数据;其中,所述待处理医疗数据包括现病史相关文本、病历检查文本以及影像检查文本中的至少一种;
对所述待处理医疗数据进行分词得到多个分词结果,并去除所述分词结果中的停止词;
对去除停止词之后剩余的各所述分词结果进行拼接,得到所述待分类医疗文本。
3.根据权利要求1所述的医疗文本分类方法,其特征在于,根据各所述医学特征属性针对所述待分类医疗文本的注意力值对所述待分类医疗文本进行分类包括:
利用预设的医疗分类模型中包括的分类判别器,对各所述医学特征属性针对所述待分类医疗文本的注意力值进行加权求和,并根据加权求和结果对所述待分类医疗文本进行分类,得到所述待分类医疗文本的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医渡云(北京)技术有限公司,未经医渡云(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010194565.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于混合烟花算法的分子构象搜索方法
- 下一篇:一种高导用异形电磁线