[发明专利]疾病筛查文本分类方法、计算机设备和可读存储介质有效
申请号: | 201910654194.X | 申请日: | 2019-07-19 |
公开(公告)号: | CN110472049B | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 徐小栋;李巍豪;梁欣然 | 申请(专利权)人: | 上海联影智能医疗科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/335;G16H50/70 |
代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 朱五云 |
地址: | 200232 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 疾病 文本 分类 方法 计算机 设备 可读 存储 介质 | ||
本申请涉及一种疾病筛查文本分类方法、计算机设备和可读存储介质。该方法包括:获取待分类的疾病筛查文本并进行序列化处理,得到该文本中每个分词对应的独热向量;将每个分词对应的独热向量输入词嵌入网络,得到每个分词对应的特征向量;将每个分词对应的特征向量进行处理后输入文本分类网络,得到疾病筛查文本的分类结果。该方法中,首先利用词嵌入网络对每个分词的独热向量进行特征提取,得到每个分词的特征向量,这样可以充分利用每个分词的特征信息进行后续分析,避免冗余信息对分类结果的干扰;再利用文本分类网络对每个分词的特征向量进行特征映射及分类,最终得到疾病筛查文本的分类结果,大大提高了疾病筛查文本分类结果的准确性。
技术领域
本申请涉及计算机技术领域,特别是涉及一种疾病筛查文本分类方法、计算机设备和可读存储介质。
背景技术
在医疗领域中,肺结节筛查主要由影像科医生阅读胸片并书写相应的临床报告,虽然目前已有一些辅助医生进行肺结节筛查的机器算法,但大部分筛查结果仍需要医生进行判断并书写临床报告。当需要对大量的临床报告进行肺结节病灶区域的分析统计及对比时,由人工来进行这项工作会及其不便,并且效率较低。
因此,已有传统技术提出利用关键字匹配技术对医生书写的临床报告进行分析,对临床报告中的肺结节区域或类别进行判断分类,以供后续分析统计及对比。
但是,利用传统技术对临床报告进行判断分类的准确率不高。
发明内容
基于此,有必要针对传统技术对临床报告进行判断分类的准确率不高的问题,提供一种疾病筛查文本分类方法、计算机设备和可读存储介质。
第一方面,本申请实施例提供一种疾病筛查文本分类方法,包括:
获取待分类的疾病筛查文本,并对疾病筛查文本进行序列化处理,得到疾病筛查文本中每个分词对应的独热向量;
将疾病筛查文本中每个分词对应的独热向量输入词嵌入网络,得到每个分词对应的特征向量;
将疾病筛查文本中每个分词对应的特征向量进行处理后输入文本分类网络,得到疾病筛查文本的分类结果。
第二方面,本申请实施例提供一种疾病筛查文本分类装置,包括:
获取模块,用于获取待分类的疾病筛查文本,并对疾病筛查文本进行序列化处理,得到疾病筛查文本中每个分词对应的独热向量;
词嵌入模块,用于将疾病筛查文本中每个分词对应的独热向量输入词嵌入网络,得到每个分词对应的特征向量;
分类模块,用于将疾病筛查文本中每个分词对应的特征向量进行处理后输入文本分类网络,得到疾病筛查文本的分类结果。
第三方面,本申请实施例提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
获取待分类的疾病筛查文本,并对疾病筛查文本进行序列化处理,得到疾病筛查文本中每个分词对应的独热向量;
将疾病筛查文本中每个分词对应的独热向量输入词嵌入网络,得到每个分词对应的特征向量;
将疾病筛查文本中每个分词对应的特征向量进行处理后输入文本分类网络,得到疾病筛查文本的分类结果。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待分类的疾病筛查文本,并对疾病筛查文本进行序列化处理,得到疾病筛查文本中每个分词对应的独热向量;
将疾病筛查文本中每个分词对应的独热向量输入词嵌入网络,得到每个分词对应的特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海联影智能医疗科技有限公司,未经上海联影智能医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910654194.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种辅助判决方法、装置及终端设备
- 下一篇:一种团伙聚类方法和装置