[发明专利]一种用于对象界定的系统及方法在审
申请号: | 202110015453.1 | 申请日: | 2021-01-05 |
公开(公告)号: | CN112784882A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 孙少平;吴伟刚;王衍翬;潘竞旭;任钦正;鲁龙;宋颖 | 申请(专利权)人: | 航天信息股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/04;G06Q50/04;G06F16/2458;G06F16/25 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 夏德政 |
地址: | 100195 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 对象 界定 系统 方法 | ||
本发明公开了一种用于对象界定的系统及方法,属于对象界定技术领域。本发明系统包括:模型管理模块,对派生产业预测模型及派生产业识别模型进行嵌套组合,生成组合模型;对象界定模块,所述对象界定模块,包括:对象获取单元,通过数据接口,获取统计数据信息;对象界定单元,对统计数据信息,设置剥离系数,将设置剥离系数的统计数据信息,接入所述模型管理模块生成的组合模型,对组合模型进行运算,获取预测或识别的数据信息,并确定数据信息所属的派生产业,即完成对象界定。本发明在统计汇总方面更加精准,针对统计调查工作更有针对性。
技术领域
本发明涉及对象界定技术领域,并且更具体地,涉及一种用于对象界定的系统及方法。
背景技术
对象界定,指根据获得的数据信息,从全部数据中筛选出满足特征要求的数据集合,并设置指定数据属性的剥离系数(权重),形成一个对象库,开展后续统计工作,对象界定一般是针对跨行业的派生产业界定。
目前,市场上的对象界定一般仅基于数据属性信息进行,且界定的方法主要是对数据属性的筛选,随着国家统计工作的进一步发展,对象界定需要借助机器学习相关算法,使得界定更加具有针对性和灵活性。
现有技术中单纯依赖数据属性信息进行对象界定,非常的有局限性,且精准性和工作效率较低。
发明内容
针对上述问题,本发明提出了一种用于对象界定的系统,包括:
模型管理模块,所述模型管理模块,对派生产业预测模型及派生产业识别模型进行嵌套组合,生成组合模型;
对象界定模块,所述对象界定模块,包括:
对象获取单元,所述对象获取单元,通过数据接口,获取统计数据信息;
对象界定单元,所述对象界定单元,对统计数据信息,设置剥离系数,将设置剥离系数的统计数据信息,接入所述模型管理模块生成的组合模型,对组合模型进行运算,获取预测或识别的数据信息,并确定数据信息所属的派生产业,即完成对象界定。
可选的,派生产业预测模型,根据逻辑回归分类算法构建,以派生产业数据进行训练;
所述模型如下:
其中,k为分类数,x为特征参数,θ为回归系数,w为权重;
所述派生产业数据的指标,包括:名称、地址、行业、范围、区划及主营业务活动;针对指标添加权重。
可选的,派生产业识别模型,通过聚类算法进行识别,且设置聚类中心为派生产业数,质心点在派生产业中选取任意一个,距离量度使用欧式距离。
可选的,数据接口,包括:数据库接口、文件接口及XML接口。
可选的,对象界定模块,还包括:对象展示单元,所述对象展示单元将对象界定结果以列表或图形的形式进行展示,并对列表及图形进行保存。
本发明还提出了一种用于对象界定的方法,包括:
对派生产业预测模型及派生产业识别模型进行嵌套组合,生成组合模型;
通过数据接口,获取统计数据信息;
对统计数据信息,设置剥离系数,将设置剥离系数的统计数据信息,接入所述模型管理模块生成的组合模型,对组合模型进行运算,获取预测或识别的数据信息,并确定数据信息所属的派生产业,即完成对象界定。
可选的,生产业预测模型,根据逻辑回归分类算法构建,以派生产业数据进行训练;
所述模型如下:
其中,k为分类数,x为特征参数,θ为回归系数,w为权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110015453.1/2.html,转载请声明来源钻瓜专利网。