[发明专利]基于特征碰撞的预判方法、装置、设备及可读存储介质在审
申请号: | 202111280721.9 | 申请日: | 2021-11-01 |
公开(公告)号: | CN114005129A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 皇甫潇潇;施建安;庄一波;孙志伟;林家彬 | 申请(专利权)人: | 厦门市易联众易惠科技有限公司 |
主分类号: | G06V30/418 | 分类号: | G06V30/418;G06K9/62;G16H10/60 |
代理公司: | 厦门智慧呈睿知识产权代理事务所(普通合伙) 35222 | 代理人: | 陈晓思 |
地址: | 361000 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 碰撞 方法 装置 设备 可读 存储 介质 | ||
本发明提供了一种基于特征碰撞的预判方法、装置、设备及可读存储介质,包括:获取多个样本,对其进行特征提取,并根据分析目标形成特征集合;确定每次在特征集合中提取的特征的数量k,提取k个特征,并根据k个特征形成第一特征分支;将选取的k个特征放回特征集合,再重新在特征集合选取k个特征,判断重新选取的k个特征是否与之前选取的特征相同,若是累计第一特征分支的数量,若否建立根据重新选取的k个特征形成第二特征分支,重复预设次数之后,形成分支群,确定分支群中的多个关键特征;采用关键特征对用户信息进行特征锚射匹配,根据匹配数据生成用户的预判结果。改善了现有的预判方式中,单一维度误差波动性大、且抗噪能力低的问题。
技术领域
本发明涉及数据分析领域,特别涉及一种基于特征碰撞的预判方法、装置、设备及可读存储介质。
背景技术
在现有的一些医疗系统中,会对历史患者病历档案的信息进行处理,例如,对历史患者病历进行特征提取,可以通过收集到患者的资料与历史患者病历的特征进行分析对比,预判出患者的身体状况。
然而,在现有技术中,对特征提取之后,每一个特征的分支之间没有交集,导致分支结果容易片面,也就是陷入单一的线性规律,单一规律受数据波动性影响较大容易导致误判,使得预判的结果容易误导患者或医护人员。
有鉴于此,提出本申请。
发明内容
本发明公开了一种基于特征碰撞的预判方法、装置、设备及可读存储介质,旨在改善现有的预判方式中,单一维度误差波动性大、且抗噪能力低的问题。
本发明第一实施例提供了一种基于特征碰撞的预判方法,包括:
获取多个样本,对多个所述样本进行特征提取,并根据分析目标形成特征集合;
确定每次在所述特征集合中提取的特征的数量k,在所述特征集合中选取k个特征,并根据k个特征形成第一特征分支;
将选取的所述k个特征放回所述特征集合,再重新在所述特征集合选取k个特征,判断重新选取的k个特征是否与之前选取的特征相同,若是,累计第一特征分支的数量,若否,建立根据重新选取的k个特征形成第二特征分支,在重复预设次数之后,形成分支群,确定所述分支群中的多个关键特征;
获取待预判用户的用户信息,根据多个所述关键特征对所述用户信息进行特征锚射匹配,并生成匹配数据;
根据所述匹配数据生成用户的预判结果。
优选地,所述确定每次在所述特征集合中提取k个数量的特征,具体为:
多次获取每一所述样本未被提取的非参特征,以及每一次所述非参特征对应的分类情况;
以投票的方式确定样本的分类结果;
根据所述分类结果,确定在所述非参特征的错误分支率最小的情况下,对应所述特征集合被提取的特征数量定义为k。
优选地,所述确定所述分支群中的多个关键特征,具体为:
计算所述分支群中的特征分支的初始错误分支率oui(1);
选取所述分支群中的一个特征,随机对所述特征加入噪声干扰,再次计算所述特征分支的错误分支率oui(2);
计算所述特征的重要性,其中,所述特征的重要性模型为:特征的重要性IMP=∑(oui(2)-oui(1))/(分支群中的分支个数)
重复以上步骤,直至计算出所述分支群内每一所述特征的重要性;
获取特征的重要性IMP大于预设阈值多个关键特征。
优选地,所述根据所述匹配数据生成用户的预判结果,具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市易联众易惠科技有限公司,未经厦门市易联众易惠科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111280721.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种矮牵牛培育方法
- 下一篇:一种融合云端的产品分拣系统及方法