[发明专利]一种基于混合特征选择算法的民航可疑订单特征提取方法有效
申请号: | 201810140489.0 | 申请日: | 2018-02-11 |
公开(公告)号: | CN108389109B | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 林彤;丁建立;付丽洋;曾进进;曹卫东 | 申请(专利权)人: | 中国民航信息网络股份有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q50/26;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王学强 |
地址: | 101318 北京市顺义区后沙*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于混合特征选择算法的民航可疑订单特征提取方法。其包括数据预处理;选择初始特征;计算初始特征信息增益值并生成预选特征子集;利用决策树C4.5算法选出最优候选特征子集;通过序列前向浮动搜索算法生成子集,并利用决策树C4.5算法评估子集而得到最终选择的特征子集等步骤。本发明优点:在不同的搜索阶段采取不同的评估标准,通过信息增益和序列前向浮动搜索的Filter‑Wrapper混合特征选择算法,兼具Filter算法的快速计算特点和Wrapper算法的高分类精度优势,既保证了算法的性能又降低了算法的时间复杂度,既具有特征子集的动态搜索特点,避免了特征发生嵌套的可能性,又能够获得较高的可疑订单识别率。 | ||
搜索关键词: | 一种 基于 混合 特征 选择 算法 民航 可疑 订单 提取 方法 | ||
【主权项】:
1.一种基于混合特征选择算法的民航可疑订单特征提取方法,其特征在于:所述的方法包括按顺序进行的下列步骤:步骤一、对民航旅客信息服务系统的PNR订单中的数据进行关联、整合及离散化在内的预处理;步骤二、从上述预处理后的PNR订单的数据中选择与可疑订单相关的初始特征;步骤三、计算上述初始特征的信息增益值,对其进行由高到低的排序并生成预选的特征子集;步骤四、利用上述初始特征的信息增益值计算其增益率,选择增益率最大的初始特征作为最优划分属性特征,然后利用决策树C4.5算法评估上述预选的特征子集,选出使得对可疑订单识别率最高的具有m个特征的特征子集作为最优候选特征子集;步骤五、通过序列前向浮动搜索算法对上述最优候选特征子集进行迭代而生成新的特征子集,并利用步骤四中的决策树C4.5算法评估每次迭代生成的新的特征子集,评估结果最优的特征子集即为最终选择的特征子集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航信息网络股份有限公司,未经中国民航信息网络股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810140489.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种虚拟三维试衣方法及系统
- 下一篇:面向无人值守商店的自助购物方法、系统