[发明专利]一种增强局部特征提取的中医辅助诊断系统及方法有效
申请号: | 202110236106.1 | 申请日: | 2021-03-03 |
公开(公告)号: | CN113066572B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 袁锋;徐传杰;张宇昂;王冰 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G06N3/045;G06N3/0464;G06N3/08;G06F40/289 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 董雪 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 增强 局部 特征 提取 中医 辅助 诊断 系统 方法 | ||
1.一种增强局部特征提取的中医辅助诊断系统,其特征在于,包括:
数据获取模块,用于获取待测中医诊断文本;
局部特征向量获取模块,用于获取待测中医诊断文本中的局部特征向量;
疾病预测模块,用于将局部特征向量输入训练好的中医辅助诊断模型中,获得疾病预测结果,其中,中医辅助诊断模型包括BERT网络、卷积神经网络和softmax层,BERT网络的输出与局部特征向量一起作为卷积神经网络的输入,卷积神经网络的输出作为softmax层的输入;
所述疾病预测模块中中医辅助诊断模型为:
BERT网络以局部特征向量为输入,输出文本的全局表示向量,在局部特征向量中融入全局表示向量后作为卷积神经网络的输入,输出文本特征向量,将文本特征向量输入softmax层中进行疾病预测;具体为:
令Wt为长度为n的句子的特征向量中第t个字的向量表示,则使用BERT进行编码得到ht:
ht=BERT(wt)
将所有句子的特征向量输入到BERT后,便可以得到当前文本的局部特征表示向量H:
H=[h1;h2;...hn]
将所得到的当前文本的局部特征表示向量H经过平均池化层得到最终的全局表示向量g:
g=Average(H)
在获得全局表示向量g之后,将全局表示向量g融入到局部特征向量中,作为卷积神经网络的输入来进行文本特征提取;经过卷积神经网络提取后得到文本特征向量L:
L=conv(xt-1,g,xt)
在经过卷积神经网络得到文本特征向量L之后,将其通过softmax层得到最终的预测结果PL:
PL=softmax(L)。
2.如权利要求1所述的增强局部特征提取的中医辅助诊断系统,其特征在于,疾病预测模块通过BERT网络获取全局表示向量的具体过程为:
将局部特征向量输入BERT网络中进行编码,获取局部特征表示向量;
将局部特征表示向量经过平均池化获得全局表示向量。
3.如权利要求1所述的增强局部特征提取的中医辅助诊断系统,其特征在于,局部特征向量获取模块对于获取的待测中医诊断文本采用字符级输入方式。
4.如权利要求1所述的增强局部特征提取的中医辅助诊断系统,其特征在于,局部特征向量获取模块在通过待测中医诊断文本获取局部特征向量前,对待测中医诊断文本进行去除停用词操作。
5.如权利要求1所述的增强局部特征提取的中医辅助诊断系统,其特征在于,局部特征向量获取模块通过获取待测中医诊断文本每个句子的特征向量,组成局部特征向量。
6.如权利要求1所述的增强局部特征提取的中医辅助诊断系统,其特征在于,疾病预测模块通过获取已有的中医诊断文本与对应疾病,构建训练集;通过训练集对构建的中医辅助诊断模型进行训练,获取训练好的中医辅助诊断模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110236106.1/1.html,转载请声明来源钻瓜专利网。