[发明专利]一种基于GCN半监督的航空乘客的分类方法和系统及其设备有效
申请号: | 202110503969.0 | 申请日: | 2021-05-10 |
公开(公告)号: | CN112926701B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 高熙 | 申请(专利权)人: | 北京人人云图信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G06Q30/02;G06Q50/30 |
代理公司: | 北京中创云知识产权代理事务所(普通合伙) 11837 | 代理人: | 肖佳 |
地址: | 100191 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gcn 监督 航空 乘客 分类 方法 系统 及其 设备 | ||
1.一种基于GCN半监督的航空乘客的分类方法,其特征在于,包括:
提取N个用户的属性和行为数据,进行预处理;
所述提取N 个 用户的属性和行为数据,进行预处理,包括,提取用户的属性数据,包括用户年龄、用户性别、用户会员等级、用户所在城市、用户近一年在本航司的订单数量、用户近一年在本航司去过的不同城市个数和用户近一年的购买频率;提取用户的行为数据,包括用户搜索交易航段的次数、用户浏览时长、用户搜索不同航段的个数、用户搜索与交易的时间差、用户交易票价的折扣、用户的票数、用户交易时段、用户交易时间与起飞的时间差、用户起飞日是否归属节日;
计算用户之间的相似度,生成N*N邻接矩阵A;
所述计算用户之间的相似度,生成邻接矩阵,包括,将每个用户看作一个节点,根据历史用户的属性数据生成节点的属性;根据历史用户的行为数据生成对应节点的特征向量;分别计算两两属性向量的余弦相似度,当相似度高于设定阈值T时,依次连接N个用户的属性相似的节点,形成N*N邻接矩阵A;
通过GCN对用户进行训练,生成分类模型;
所述通过GCN对用户进行训练,生成分类模型,包括,将所述N*N邻接矩阵A进行自连接,生成N*N矩阵L,定义两层GCN模型,输入节点特征向量,将已有标签的用户节点分成训练集和测试集,在训练节点上计算损失值,反向传播计算参数的梯度,用优化方法进行梯度更新,得到分类模型;
将未分类的用户送入已经训练好的分类模型,根据分类结果,标注乘客类型;
将未分类的用户和已分类用户重新生成邻接矩阵,通过GCN训练后,更新所述分类模型。
2.根据权利要求1所述的基于GCN半监督的航空乘客的分类方法,其特征在于,所述乘客类型包括商务乘客和普通乘客。
3.一种基于GCN半监督的航空乘客的分类系统,其特征在于,包括:
提取模块,用于提取N个用户的属性和行为数据,进行预处理;
所述提取模块包括:属性数据提取单元,用于提取用户的属性数据,包括用户年龄、用户性别、用户会员等级、用户所在城市、用户近一年在本航司的订单数量、用户近一年在本航司去过的不同城市个数和用户近一年的购买频率;行为数据提取单元,用于提取用户的行为数据,包括用户搜索交易航段的次数、用户浏览时长、用户搜索不同航段的个数、用户搜索与交易的时间差、用户交易票价的折扣、用户的票数、用户交易时段、用户交易时间与起飞的时间差、用户起飞日是否归属节日;
分析模块,用于计算用户之间的相似度,生成N*N邻接矩阵A;
所述分析模块包括,节点单元,用于将每个用户看作一个节点,根据历史用户的属性数据生成节点的属性;向量单元,用于根据历史用户的行为数据生成对应节点的特征向量;矩阵单元,用于分别计算两两属性向量的余弦相似度,当相似度高于设定阈值T时,依次连接N个用户的属性相似的节点,形成N*N邻接矩阵A;
训练模块,用于通过GCN对用户进行训练,生成分类模型;
所述训练模块将所述N*N邻接矩阵A进行自连接,生成N*N矩阵L,定义两层GCN模型,输入节点特征向量,将已有标签的用户节点分成训练集和测试集,在训练节点上计算损失值,反向传播计算参数的梯度,用优化方法进行梯度更新,得到分类模型;
分类模块,用于将未分类的用户送入已经训练好的分类模型,根据分类结果,标注乘客类型;
调整模块,用于将未分类的用户和已分类用户重新生成邻接矩阵,通过GCN训练后,更新所述分类模型。
4.根据权利要求3所述的基于GCN半监督的航空乘客的分类系统,其特征在于,所述提取模块包括:
属性数据提取单元,用于提取用户的属性数据,包括用户年龄、用户性别、用户会员等级、用户所在城市、用户近一年在本航司的订单数量、用户近一年在本航司去过的不同城市个数和用户近一年的购买频率;
行为数据提取单元,用于提取用户的行为数据,包括用户搜索交易航段的次数、用户浏览时长、用户搜索不同航段的个数、用户搜索与交易的时间差、用户交易票价的折扣、用户的票数、用户交易时段、用户交易时间与起飞的时间差、用户起飞日是否归属节日。
5.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至2中任一项所述的基于GCN半监督的航空乘客的分类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京人人云图信息技术有限公司,未经北京人人云图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110503969.0/1.html,转载请声明来源钻瓜专利网。