[发明专利]一种基于特征值进行前列腺癌复发预测的系统和方法在审
申请号: | 201710113827.7 | 申请日: | 2017-02-28 |
公开(公告)号: | CN106778046A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 荣小辉;张洋;高彦回;刘为 | 申请(专利权)人: | 思派(北京)网络科技有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京天达知识产权代理事务所(普通合伙)11386 | 代理人: | 张春,龚颐雯 |
地址: | 100082 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征值 进行 前列腺癌 复发 预测 系统 方法 | ||
1.一种基于特征值进行前列腺癌复发预测的系统,其特征在于,包括医生工作站和服务器,
医生工作站用于接收输入信息和显示预测结果;
服务器包括信息获取模块、预处理模块、模型训练模块、信息接收模块、前列腺癌复发预测器;
信息获取模块获取前列腺癌病例的电子数据,从中获得训练集合;
预处理模块提取训练集合中的每个病例的特征信息,对提取的特征信息进行预处理,生成训练用特征词集合,并为集合中的特征词生成对应的特征值,将特征值输入到模型训练模块;预处理模块还用于对用户输入信息进行特征信息提取、预处理和生成特征值的处理,并将该特征值输入到经过训练的前列腺癌复发预测器;
模型训练模块利用特征值,训练聚类分析模型,得到前列腺癌复发预测器;
信息接收模块接收用户通过医生工作站输入的信息,并将接收的信息传输到预处理模块;
经过训练的前列腺癌复发预测器根据预处理模块处理用户输入信息得到的特征值,得到前列腺癌复发的预测结果,并输出到医生工作站。
2.根据权利要求1所述的基于特征值进行前列腺癌复发预测的系统,其特征在于,所述预处理模块中提取的特征信息包括:前列腺癌的术前psa,术前fpsa,肿瘤级别、淋巴转移、骨转移、评分、是否生化复发。
3.根据权利要求1所述的基于特征值进行前列腺癌复发预测的系统,其特征在于,所述预处理模块中的预处理包括:对提取的特征信息进行分词;对噪声词进行剔除处理。
4.根据权利要求3所述的基于特征值进行前列腺癌复发预测的系统,其特征在于,在分词和噪声词剔除处理之后,还包括对特征词集合中的同义词进行替换。
5.根据权利要求1或3或4所述的基于特征值进行前列腺癌复发预测的系统,其特征在于,预处理模块还包括对训练用特征词集合中的特征词进行特征选择。
6.根据权利要求1所述的基于特征值进行前列腺癌复发预测的系统,其特征在于,所述预处理模块采用Hash算法为特征词生成对应的特征值,或者基于预先建立赋值表给特征词生成对应的特征值。
7.根据权利要求1所述的基于特征值进行前列腺癌复发预测的系统,其特征在于,所述聚类分析模型基于K-means算法。
8.根据权利要求1所述的基于特征值进行前列腺癌复发预测的系统,其特征在于,所述服务器还包括测试模块,用于对经过训练的前列腺癌复发预测器进行测试。
9.根据权利要求8所述的基于特征值进行前列腺癌复发预测的方法,其特征在于,在前列腺癌复发预测器的测试结果不理想的情况下,更改聚类分析算法或更改特征选择的数量,以对前列腺癌复发预测器进行调整;基于重新获得的前列腺癌复发预测器,再进行测试;通过不断调整前列腺癌复发预测器,不断重新测试,直到测试结果达标。
10.一种基于特征值进行前列腺癌复发预测的方法,其特征在于,包括以下步骤:
步骤S1.获取前列腺癌病例的电子数据,从电子数据获得用于预测前列腺癌复发用的训练集合;
步骤S2.提取训练集合中的每个病例的特征信息;
步骤S3.对提取的特征信息进行预处理,生成训练用特征词集合;
步骤S4.为训练用特征词集合中的特征词生成对应的特征值;
步骤S5.利用上一步生成的特征值,训练聚类分析模型,得到前列腺癌复发预测器;
步骤S6.接收用户输入的、对前列腺癌的描述信息;
步骤S7.对用户的输入信息进行特征信息提取、预处理和生成特征值的处理,处理方法同步骤S2~S4,得到待预测信息的特征值;
步骤S8.前列腺癌复发预测器根据待预测信息的特征值,得到前列腺癌复发的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思派(北京)网络科技有限公司,未经思派(北京)网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710113827.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:患者信息管理系统
- 下一篇:一种基于多维度医学图像的中医面诊综合系统
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用