[发明专利]基于大数据的居民收入预测系统及其预测方法在审
申请号: | 202210154973.5 | 申请日: | 2022-02-21 |
公开(公告)号: | CN114529085A | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 刘笑颖 | 申请(专利权)人: | 杭州邬萍科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/04;G06N3/08 |
代理公司: | 北京恒泰铭睿知识产权代理有限公司 11642 | 代理人: | 李晓春 |
地址: | 310000 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 居民收入 预测 系统 及其 方法 | ||
1.一种基于大数据的居民收入预测系统,其特征在于,包括:
数据获取单元,用于获取与居民收入相关的所有离散型变量和所有连续型变量,所述离散型变量包括工作类别、受教育程度、婚姻状况、职业、社会角色、种族、性别和国籍,所述连续型变量包括年龄、需要、受教育时间、资本收益、资本支出和每周工作时间;
第一全局编码单元,用于将所有所述离散型变量通过包含嵌入层的基于上下文的编码器模型以获得多个离散特征向量,并将所述多个离散特征向量二维拼接为离散特征矩阵;
邻接矩阵构造单元,用于基于各个所述离散型变量之间的合取逻辑和析取逻辑,构造所述多个离散型变量的合取邻接矩阵和析取邻接矩阵,其中,在所述合取邻接矩阵中,如果两个离散型变量之间存在合取范式,则对应位置的特征值1,如果两个离散型变量之间不存在合取范式,则对应位置的特征值为0,在所述析取邻接特征矩阵中,如果两个离散型变量之间存在析取范式,则对应位置的特征值为1,如果两个离散型变量之间不存在析取范式,则对应位置的特征值为0;
邻接特征矩阵生成单元,用于分别将所述合取邻接矩阵和所述析取邻接矩阵通过卷积神经网络以获得合取特征矩阵和析取特征矩阵,并计算所述合取特征矩阵和所述析取特征矩阵之间的按位置加权和以获得邻接特征矩阵;
第一融合单元,用于将所述离散特征矩阵与所述邻接特征矩阵进行矩阵相乘以获得第一特征矩阵;
第二全局编码单元,用于将所有所述连续型变量通过所述包含嵌入层的基于上下文的编码器模型以获得多个连续特征向量;
实数权重矩阵构造单元,用于分别对所述多个连续特征向量中各个连续特征向量进行归一化处理以获得多个归一化特征向量,并将所述多个归一化特征向量二维拼接为归一化特征矩阵,其中,所述归一化特征矩阵为与离散变量的0/1邻接关系表达相对应的实数权重矩阵;
激活函数构造单元,用于基于所述实数权重矩阵和所述邻接特征矩阵使用逻辑激活函数来构造第一逻辑激活函数和第二逻辑激活函数,其中,所述第一逻辑激活函数基于所述实数权重矩阵和所述邻接特征矩阵之间的乘积生成,所述第二逻辑激活函数基于单位矩阵减去所述邻接特征矩阵与所述单位矩阵减去所述实数权重矩阵的结果之间的乘积的结果生成;
激活单元,用于使用所述第一逻辑激活函数和所述第二逻辑激活函数对每个所述连续型变量对应的连续特征向量进行激活以获得第一激活向量和第二激活向量,并计算所述第一激活向量和所述第二激活向量之间的按位置加权以获得与每个所述连续型变量对应的最终激活向量;
二维排列单元,用于将与每个所述连续型变量对应的最终激活向量进行二维排列以获得第二特征矩阵;
第二融合单元,用于融合所述第一特征矩阵和所述第二特征矩阵以获得回归矩阵;以及
回归单元,用于对所述回归矩阵进行回归解码以获得居民收入的预测值。
2.根据权利要求1所述的基于大数据的居民收入预测系统,其中,所述第一全局编码单元,包括:
嵌入向量转化子单元,用于使用所述编码器模型的嵌入层分别将所述离散型变量转化为输入向量以获得输入向量的序列,其中,所述输入向量的序列中每一输入向量对应于一个所述离散型变量;以及
转换器子单元,用于将所述输入向量的序列通过所述编码器模型的转换器以获得多个离散特征向量;以及
矩阵拼接子单元,用于将所述多个离散特征向量二维拼接为所述离散特征矩阵。
3.根据权利要求2所述的基于大数据的居民收入预测系统,其中,所述邻接矩阵构造单元,进一步用于:
基于各个所述离散型变量之间的合取逻辑以如下公式来构建所述合取邻接矩阵;
其中,所述公式为:
其中,是合取矩阵,用于表示相应的一对规则构成合取范式时矩阵位置取1,而非合取范式时矩阵位置取0;以及
基于各个所述离散型变量之间的析取逻辑以如下公式来构建所述析取邻接矩阵;
其中,所述公式为:
其中,是析取邻接矩阵,用于表示相应的一对规则构成析取范式时矩阵位置取1,而非析取范式时矩阵位置取0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州邬萍科技有限公司,未经杭州邬萍科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210154973.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带有人工智能分料结构的播种机
- 下一篇:一种发泡水泥板成型方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置