[发明专利]特征提取方法及特征提取装置、设备、存储介质有效
申请号: | 201710623738.7 | 申请日: | 2017-07-27 |
公开(公告)号: | CN110021386B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 王东;王琦;陈中阳 | 申请(专利权)人: | 北大医疗信息技术有限公司 |
主分类号: | G16H10/00 | 分类号: | G16H10/00;G06F16/36;G06F18/23;G06F18/241 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 提取 方法 装置 设备 存储 介质 | ||
1.一种结构化医疗数据的特征提取方法,其特征在于,包括:
判断是否根据设定标签对结构化医疗数据进行特征提取;
若判定不根据所述设定标签对所述结构化医疗数据进行特征提取,则执行以下特征提取操作:
根据预设特征提取算法提取所述结构化医疗数据的第一数据特征组,
根据预设聚类算法对所述结构化医疗数据进行处理得到多个第一数据分组,对所述多个第一数据分组进行特征提取得到所述结构化医疗数据的第二数据特征组,
根据所述第一数据特征组和所述第二数据特征组分析确定所述结构化医疗数据的目标数据特征;
若判定根据所述设定标签对所述结构化医疗数据进行特征提取,则执行以下特征提取操作:
根据预设特征提取算法提取所述结构化医疗数据的第三数据特征组,
根据所述设定标签所属的变量类型确定所述结构化医疗数据的多个第二数据分组,对所述多个第二数据分组进行特征提取得到所述结构化医疗数据的第四数据特征组,
根据所述第三数据特征组和所述第四数据特征组确定所述结构化医疗数据的目标数据特征;
所述对所述多个第一数据分组进行特征提取得到所述结构化医疗数据的第二数据特征组的步骤以及所述对所述多个第二数据分组进行特征提取得到所述结构化医疗数据的第四数据特征组的步骤分别具体包括:
获取对应多个数据分组中的每个数据分组内的组内共性特征;
获取对应多个数据分组中的每两个数据分组间的组间差异特征;
根据所述组内共性特征和所述组间差异特征确定对应的数据特征组;
其中,所述结构化医疗数据的来源包括以下至少一项:统计报表、医疗卫生工作记录和专题性资料。
2.根据权利要求1所述的特征提取方法,其特征在于,所述根据所述设定标签所属的变量类型确定所述结构化医疗数据的多个第二数据分组的步骤包括:
当所述设定标签所属的变量类型为连续变量时,对所述结构化医疗数据进行离散化处理,按照所述设定标签对经离散化处理的所述结构化医疗数据进行分组得到所述多个第二数据分组;
当所述设定标签所属的变量类型为离散变量时,按照所述设定标签对所述结构化医疗数据进行分组得到所述多个第二数据分组;
当所述设定标签所属的变量类型为分类变量时,将所述结构化医疗数据的当前分组作为所述多个第二数据分组。
3.根据权利要求1或2所述的特征提取方法,其特征在于,
所述根据所述第一数据特征组和所述第二数据特征组分析确定所述结构化医疗数据的目标数据特征的步骤,具体包括:
将所述第一数据特征组和所述第二特征数据组中包含的所有数据特征作为所述目标数据特征输出;或者
按照第一预设权重系数对所述第一数据特征组和所述第二数据特征组中包含的所有数据特征进行特征权重值计算;
将大于第一预设权重值的特征权重值对应的数据特征确定为所述目标数据特征;以及
所述根据所述第三数据特征组和所述第四数据特征组分析确定所述结构化医疗数据的目标数据特征的步骤,具体包括:
将所述第三数据特征组和所述第四数据特征组中包含的所有特征作为所述目标数据特征输出;或者
按照第二预设权重系数对所述第三数据特征组和所述第四数据特征组中包含的所有数据特征进行特征权重值计算;
将大于第二预设权重值的特征权重值对应的数据特征确定为所述目标数据特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大医疗信息技术有限公司,未经北大医疗信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710623738.7/1.html,转载请声明来源钻瓜专利网。