[发明专利]人工授精成功率的影响因素计算方法、系统及计算机设备在审
申请号: | 201910593797.3 | 申请日: | 2019-07-03 |
公开(公告)号: | CN110322967A | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | 雷大江;张莉萍;陈浩;李智星;张玉枫;吴渝 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G16H50/50 | 分类号: | G16H50/50 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 卢胜斌 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 影响因素 计算机设备 人工授精 模型参数 成功率 多元逻辑回归 结构化信息 参数约束 交叉验证 类别差异 输出 共线性 归一化 解释性 影响度 最大化 算法 妊娠 转换 | ||
1.一种基于极大无关多元逻辑回归的多囊卵巢综合征患者夫精宫腔内人工授精成功率的影响因素计算方法,其特征在于,所述方法包括:
步骤1,收集病例的结构化信息,提取是否妊娠信息及其相关特征;
步骤2,对妊娠信息及其相关特征进行转换;
步骤3,采用交叉验证结合网格搜索的方式训练极大无关多元逻辑回归模型;
步骤4,输出最优超参下每个类别对应的模型参数,对所有模型参数进行最大最小归一化,将参数约束到[0,1]区间内,作为影响度输出。
2.根据权利要求1所述的方法,其特征在于,对妊娠信息及其相关特征进行转换,包括:
模拟区间分组,对数值属性进行离散编码操作;
对离散编码后的数值属性进行z分数z-score编码操作;
对标称属性和妊娠信息进行独热one-hot编码操作;
设置成功妊娠编码为1,未妊娠编码为0,作为极大无关多元逻辑回归模型拟合的两个不同类别。
3.根据权利要求1所述的方法,其特征在于,采用交叉验证结合网格搜索的方式训练极大无关多元逻辑回归模型,包括:
选定K折交叉验证的折数为5折,保证训练集与测试集的比例为4:1;
采用网格搜索GridSearch的调参方法确定极大无关多元逻辑回归的最优超参;
假设样本数量为n,样本特征数量为m,类别数k=2,包括成功妊娠类别和未妊娠类别;样本表示为(x,y),极大无关多元逻辑回归的模型的优化目标为:
其中x∈Rn×m为特征信息,y∈Rn为监督信息,θ∈Rm×k为模型参数,R为实数矩阵;公式中为不相关约束项,用来最大化成功妊娠和未妊娠之间的差异;θi和θj为任意两组不同的参数,其中θ0为未妊娠类别对应的模型参数,θ1为成功妊娠类别对应的模型参数;T表示向量或矩阵的转置;{y(i)=j}为指示函数,当y(i)=j时,函数1{y(i)=j}为1,否则为0;a为不相关约束函数。
4.根据权利要求3所述的方法,其特征在于,所述网格搜索调参方法的搜索范围为:
其中a为不相关约束系数,max_iter为算法迭代的最大次数,normalize代表是否执行归一化操作,若执行归一化操作,则特征将会被减去均值后除以L2范数。
5.根据权利要求1所述的方法,其特征在于,输出最优超参下每个类别对应的模型参数,对所有模型参数进行最大最小归一化,将参数约束到[0,1]区间内,作为影响度输出,包括:
根据交叉验证与网格搜索的结果,挑选出最优超参,重新训练极大无关多元逻辑回归模型;
利用极大无关多元逻辑回归模型对每一个类别中的每一个特征拟合一个特定的参数;
输出最优超参下每个类别对应的模型参数,并归一化至[0,1]区间内,做为特征重要性输出;
对于成功妊娠类别,该类别的模型参数越大,其对应的特征相对于成功妊娠越重要;
对于未妊娠类别,该类别的模型参数越大,其对应的特征相对于未妊娠越重要。
6.一种基于极大无关多元逻辑回归的多囊卵巢综合征患者夫精宫腔内人工授精成功率的影响因素计算系统,其特征在于,所述系统包括:
信息和特征提取模块,用于收集病例的结构化信息,提取是否妊娠信息及其相关特征;
特征转换模块,用于对妊娠信息及其相关特征进行转换;
模型训练模块,用于采用交叉验证结合网格搜索的方式训练极大无关多元逻辑回归模型;
影响度输出模块,用于输出最优超参下每个类别对应的模型参数,对所有模型参数进行最大最小归一化,将参数约束到[0,1]区间内,作为影响度输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910593797.3/1.html,转载请声明来源钻瓜专利网。