[发明专利]一种基于半监督邻域判别指数的乳腺癌诊断系统有效
申请号: | 201811615503.4 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109711469B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 张莉;庞晴晴;王邦军;周伟达 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/764;G06V10/771;G06V10/774;G16H50/20 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 215137 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 邻域 判别 指数 乳腺癌 诊断 系统 | ||
本发明公开了一种基于半监督邻域判别指数的乳腺癌诊断系统,包括数据获取模块、特征提取模块、特征筛选模块、分类模块,能够获取有标签的乳腺细胞数据样本和无标签的乳腺细胞数据样本,并提取出乳腺细胞数据样本的多个特征,然后计算各个特征的半监督邻域判别指数,并从这些特征中筛选出半监督邻域判别指数满足预设条件的特征,最后根据筛选出的特征对待诊断的乳腺细胞数据样本进行诊断,得到诊断结果。可见,该方法基于半监督学习实现,通过计算各个特征的半监督邻域判别指数,筛选出与乳腺癌关联程度最大的特征,并在诊断过程中从待诊断数据样本中提取出这些特征数据,最后得到诊断结果,避免了为大量数据增加标签的过程,大大节省了开销。
技术领域
本发明涉及计算机领域,特别涉及一种基于半监督邻域判别指数的乳腺癌诊断系统。
背景技术
全球乳腺癌发病率自20世纪70年代末开始一直呈上升趋势。据统计,美国每8名妇女中就会有1人患乳腺癌。近年我国乳腺癌发病率的增长速度高出发达国家1%~2%。乳腺癌防治的关键是早发现,早期乳腺癌尤其是零期乳腺癌通过手术,可保全乳腺且根治,费用很低,5年生存率可达90%以上。
Wang和Hu等人在“Feature Selection Based on Neighborhood DiscriminationIndex”中提出了运用邻域判别指数来进行特征选择,将香农信息理论中的基本思想引入到邻域关系上下文中,并提出了用于衡量特征子集的区分能力的判别指标,但是,该方法基于全监督学习实现,而全监督学习需要获取大量数据标签,在实际应用中,标签的获取常常需要极大的人工工作量,因此需要巨大开销。
发明内容
本发明的目的是提供一种基于半监督邻域判别指数的乳腺癌诊断系统,用以解决现有的诊断乳腺癌的方法基于全监督学习实现,需要大量数据标签,导致开销巨大的问题。
为解决上述技术问题,本发明提供了一种基于半监督邻域判别指数的乳腺癌诊断系统,包括:
数据获取模块:用于获取有标签的乳腺细胞数据样本和无标签的乳腺细胞数据样本;
特征提取模块:用于根据所述有标签的乳腺细胞数据样本和所述无标签的乳腺细胞数据样本,提取乳腺细胞数据样本的多个特征;
特征筛选模块:用于从所述多个特征中筛选出半监督邻域判别指数满足预设条件的特征;
分类模块:用于根据所述满足预设条件的特征,对待诊断的乳腺细胞数据样本进行诊断,得到诊断结果。
可选的,所述特征提取模块包括:
归一化单元:用于对有标签的乳腺细胞数据矩阵和无标签的乳腺细胞数据矩阵进行归一化,其中,所述乳腺细胞数据矩阵包括多个乳腺细胞数据样本的数据;
拼接单元:用于对归一化后的有标签的乳腺细胞数据矩阵和无标签的乳腺细胞数据矩阵进行拼接,得到目标数据矩阵;
特征提取单元:用于提取所述目标数据矩阵中的每一列数据,得到乳腺细胞数据样本的多个特征。
可选的,所述特征筛选模块具体用于:从所述多个特征中筛选出半监督邻域判别指数最大的预设数量的特征。
可选的,所述特征筛选模块包括:
判断单元:判断已筛选的特征的数量是否为0;
第一计算单元:用于在已筛选的特征的数量为0时,根据第一公式计算待筛选特征集合中各个特征的半监督邻域判别指数,其中,所述待筛选特征集合在初始化时包括所述多个特征,并随着特征的筛选过程更新;
第二计算单元:用于在已筛选的特征的数量不为0时,根据第二公式计算所述待筛选特征集合中各个特征的半监督邻域判别指数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811615503.4/2.html,转载请声明来源钻瓜专利网。