[发明专利]一种指数计算平台和方法在审

专利信息
申请号: 201710391942.0 申请日: 2017-05-27
公开(公告)号: CN107315775A 公开(公告)日: 2017-11-03
发明(设计)人: 马宁;段立新;王肃 申请(专利权)人: 国信优易数据有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27;G06Q10/06;G06N3/04;G06N3/08
代理公司: 北京青松知识产权代理事务所(特殊普通合伙)11384 代理人: 郑青松
地址: 100070 北京市丰台*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 指数 计算 平台 方法
【说明书】:

技术领域

发明涉及数据挖掘技术领域,具体涉及一种指数计算平台和方法。

背景技术

现实生活中,经常涉及对某一事物的量化评价,如对某一区域的经济能力的评价,以确切知道该区域的经济状态。这种评价一般是采取构建指数体系并对计算指数的形式来进行评价。

现有的指数编制的一般流程包括:抽样统计方法获取数据;通过人工进行指标体系制定;通过人工从指标体系确定的指标中进行特征选择;通过选择的特征对应的特征值训练指数计算模型;基于指数计算模型进行指数计算,得到指数值。

在上述流程中,指数值通过指数计算模型确定,而指数计算模型通过特征值进行训练,由于特征的选择是通过人工的方式进行,难免存在偏差,而在确定各特征的特征值时也可能存在误差,那么在前置流程充满偏差误差的前提下训练的模型的准确性也无法得到保障,最终导致得到的指数值也可能无法反映对应事物的真实情况,准确性低。

发明内容

本发明提出一种指数计算平台和方法,旨在解决指数计算模型准确性低导致通过该模型计算的指数准确性低的问题。

本发明采用的技术方案为:

本发明的一方面提供一种指数计算平台,包括:数据获取模块,用于获取进行指数计算的数据;指标体系构建模块,用于基于获取的数据构建指标体系;特征选择模块,用于对所述指标体系确定的指标进行特征选择,确定指数计算使用的特征;权重确定模块,用于将确定的特征对应的第一特征值以及作为目标变量的初始指数值输入预设深度学习模型,采用深度神经网络进行迭代训练,得到以各特征为变量的函数结构以及各特征分别对应的权重;权重和指数调整模块,用于按照预设周期执行如下调整步骤:收集表征当前指数与其所表征现实情况之间偏差的监督信息;并对收集的监督信息进行解析生成反馈标签;根据所述反馈标签表征的当前指数值的偏差方向确定对应的调整规则,并对当前指数值进行调整,得到调整后的新的当前指数值;将所述新的当前指数值输入所述预设深度学习模型,采用深度神经网络再次进行迭代训练,得到调整后的以各特征为变量的函数结构以及各特征分别对应的权重。

可选地,还包括:指数确定模块;所述指数确定模块,用于在所述权重确定模块确定出各特征分别对应的权重之后,或者在所述权重和指数调整模块得到调整后的权重之后,将确定的特征对应的第二特征值输入所述预设深度学习模型,并基于对应的权重确定指数值。

可选地,所述权重和指数调整模块,具体用于采用如下一种或多种方式收集针对当前指数值的监督信息:通过预设接口接收指定用户提供的监督信息;或者,通过爬虫程序从与当前指数所涉及领域的相关网站获取文本信息;通过解析所述文本信息确定监督信息;或者,对用户在发布当前指数的指数发布平台的访问行为进行监控,通过用户访问行为解析出监督信息;或者,通过发布当前指数的指数发布平台向用户提供问卷信息,并通过用户反馈的答复信息收集监督信息。

可选地,所述指标体系构建模块,具体用于通过指定接口接收指定用户提供的一级指标;以及基于所述一级指标,采用知识图谱生成二级指标:针对每个一级指标,确定该一级指标的同义词,并生成由该一级指标以及该一级指标的同义词构成的第一关键词词包;从所述数据获取模块获取的数据中提取与所述第一关键词词包相关的第一数据;基于所述第一数据生成第一知识图谱;将所述第一关键词词包作为键映射到所述第一知识图谱中,并从所述第一知识图谱中筛选与所述第一关键词词包相关联的节点;采用预设算法对筛选出的节点进行去冗余处理,将处理后得到的节点确定为二级指标。

可选地,所述特征选择模块,具体用于基于所述二级指标,采用知识图谱进行特征选择:针对每个二级指标,确定该二级指标的同义词,并生成由该二级指标以及该二级指标的同义词构成的第二关键词词包;从所述数据获取模块获取的数据中提取与所述第二关键词词包相关的第二数据;基于所述第二数据生成第二知识图谱;将所述第二关键词词包作为键映射到所述第二知识图谱中,并从所述第二知识图谱中筛选与所述第二关键词词包相关联的节点;采用预设算法对筛选出的节点进行去冗余处理,将处理后得到的节点确定为指数计算使用的特征。

可选地,所述特征选择模块,还用于在对筛选出的节点进行去冗余处理之后,执行如下降维处理的步骤:采用主成分分析法对所述第二知识图谱进行解析;针对每个第二关键词词包,确定与该第二关键词词包相关联的节点分别与该第二关键词词包之间的关联强度指标;响应于任一节点与对应第二关键词词包之间的关联强度指标的指标值达到预设关联强度阈值,将该任一节点确定为指数计算使用的特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国信优易数据有限公司,未经国信优易数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710391942.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top