[发明专利]医疗文本分类方法及装置、存储介质、电子设备有效
申请号: | 202010194565.3 | 申请日: | 2020-03-19 |
公开(公告)号: | CN111403028B | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 王磊;张恒 | 申请(专利权)人: | 医渡云(北京)技术有限公司 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06F16/33;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 文本 分类 方法 装置 存储 介质 电子设备 | ||
本发明实施例是关于一种医疗文本分类方法及装置、存储介质、电子设备,涉及医疗大数据处理技术领域,该方法包括:对待分类医疗文本进行编码得到多个待处理隐含向量,并根据各所述待处理隐含向量以及预设的由多个医学特征属性组成的特征矩阵,计算各所述待处理隐含向量与各所述医学特征属性之间的相关度;根据各所述待处理隐含向量与各所述医学特征属性之间的相关度,计算各所述医学特征属性针对所述待分类医疗文本的注意力值;根据各所述医学特征属性针对所述待分类医疗文本的注意力值对所述待分类医疗文本进行分类。本发明实施例提高了医疗文本的分类效率。
技术领域
本发明实施例涉及医疗大数据处理技术领域,具体而言,涉及一种医疗文本分类方法、医疗文本分类装置、计算机可读存储介质以及电子设备。
背景技术
肿瘤的分期(Tumor Staging)是目前评价肿瘤生物学行为和诊断的最重要的指标之一,肿瘤分期的目的是根据个体内原发肿瘤以及播散程度来描述恶性肿瘤的严重程度和受累范围的。准确有效的肿瘤分期方案,可以帮助医生了解病人患病的程度,制定相应的治疗计划并且了解疾病的预后和转归。
现有的肿瘤分期可以基于以下两种方案进行:一种是,多任务学习技术(multi-task learning,MTL),即利用一些可能帮助优化度量指标的其它相关任务的训练信号,通过共享相关任务之间的表征,使模型更好地处理原始任务。另一种是,注意力机制(Attention Mechanism),可以通过使用attention机制能够从句子中筛选出对于最终分类任务重要性较高的词或者词组。
但是,上述方案存在如下缺陷:一方面,上述方案都是直接利用深度学习模型进行端到端的分类训练,需要大量的有标注数据,会使得分类效率较低;另一方面,在公开标注数据的数据量较少时,会使得分类结果的准确率较低。
因此,需要提供一种新的医疗文本分类方法及装置。
需要说明的是,在上述背景技术部分发明的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明的目的在于提供一种医疗文本分类方法、医疗文本分类装置、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的分类结果的准确率较低的问题。
根据本公开的一个方面,提供一种医疗文本分类方法,包括:
对待分类医疗文本进行编码得到多个待处理隐含向量,并根据各所述待处理隐含向量以及预设的由多个医学特征属性组成的特征矩阵,计算各所述待处理隐含向量与各所述医学特征属性之间的相关度;
根据各所述待处理隐含向量与各所述医学特征属性之间的相关度,计算各所述医学特征属性针对所述待分类医疗文本的注意力值;
根据各所述医学特征属性针对所述待分类医疗文本的注意力值对所述待分类医疗文本进行分类。
在本公开的一种示例性实施例中,在对待分类医疗文本进行编码得到多个待处理隐含向量之前,所述医疗文本分类方法还包括:
获取包括多个不同路径的待处理医疗数据;其中,所述待处理医疗数据包括现病史相关文本、病历检查文本以及影像检查文本中的至少一种;
对所述待处理医疗数据进行分词得到多个分词结果,并去除所述分词结果中的停止词;
对去除停止词之后剩余的各所述分词结果进行拼接,得到所述待分类医疗文本。
在本公开的一种示例性实施例中,对待分类医疗文本进行编码得到多个待处理隐含向量包括:
将所述待分类医疗文本输入至预设的词向量生成模型中得到多个词向量,并根据所述待分类医疗文本的路径得到多个路径向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医渡云(北京)技术有限公司,未经医渡云(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010194565.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于混合烟花算法的分子构象搜索方法
- 下一篇:一种高导用异形电磁线