[发明专利]一种基于市场行情数据源的模型训练方法在审
申请号: | 201510992078.0 | 申请日: | 2015-12-25 |
公开(公告)号: | CN105631544A | 公开(公告)日: | 2016-06-01 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 苏州晨川通信科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 215500 江苏省苏州市常熟*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 市场行情 数据源 模型 训练 方法 | ||
技术领域
本发明涉及市场数据的模型训练方法,特别是一种基于市场行情数据源 的模型训练方法。
背景技术
目前,随着数据获取技术的发展和智能设备的普及,市场信息的获取日 益便捷,同时,对于金融产品价格走向需求也日益提高。现有市场预判的流 程主要是先针对行情数据提取特征,之后使用某些分类器进行分类。对数据 进行标记十分昂贵,需要花费大量的人力资源,而从互联网上获取到大多缺 乏标注。同时对于一组数据,可以有多种不同类型的特征属性解读:如可以 使用不同特征提取方法对数据进行特征抽取,每一种方法抽取到的特征构成 一个属性集;另外,市场数据本来就具有多种资源来源,从这些附带的资源 中也可以提取出特征。传统的方法一方面需要获取有标记的数据进行分类器 的训练,一方面依赖于特定的特征,无法较好地利用未标记和多组不同的特 征属性集。
市场预判往往也是多个公司、研究组织的共同需求。不同的公司或者研 究组织会针对其获取的数据使用他们自己的方法提取特征,之后根据他们提 取的特征进行分类器的训练。将多个公司(组织)的特征进行结合,无疑可 以得到更好的特征,但是各组特征涉及多个公司(组织)的隐私信息,如提 取特征的具体技术,这些往往不适合和他人共享,因此需要一种具有隐私保 护的利用不同特征进行预判的方法。
发明内容
本发明要解决的技术问题是针对现有技术的不足,提出一种成本低、市 场信息获取便捷,可避免浪费人力资源的基于市场行情数据源的模型训练方 法。
本发明要解决的技术问题是通过以下技术方案实现的。本发明是一种基 于市场行情数据源的模型训练方法,其特点是:包括以下步骤:(1)搜集数 据:从行情数据源获取训练模型样本的数据特征属性集,将每一个数据特征 属性集看作一个视图;(2)分类标记:所述每一个视图上利用本视图的分类 器进行分类提取并分别对类别进行标注,判断对数据特征的分类是否完成, 若完成,则获得搜集到训练模型样本的所有数据,若未完成,则等待所有数 据分类直至完成;(3)获取训练模型:将每个视图中训练模型样本搜集到的 所有数据拼接成一个矩阵,从而获得每一个视图的预测结果,若预测结果不 满足要求,则转入步骤(2)继续分类,若预测结果满足要求,则得到每一个 类别的分类器,从而最终获得训练模型。
优选的,所述步骤(1)的行情数据源为若干不同的数据源。
优选的,所述步骤(1)中的行情数据源获取数据特征属性集包括使用不 同的特征提取方法对行情数据进行特征提取。
与现有技术相比,本发明所提供的利用多数具有的示例分类方法,实施 过程中能够充分利用有标记数据和未标记数据上不同数据源的多种特征属 性,适合数据源很多的情况,同时在整个训练过程中能够确保每一个数据源 的特征属性不被其它数据源所获取。
附图说明
图1为本发明的流程框图。
具体实施方式
以下参照附图,进一步描述本发明的具体技术方案,以便于本领域的技 术人员进一步地理解本发明,而不构成其权力的限制。
实施例1,参照图1,一种基于市场行情数据源的模型训练方法,包括以 下步骤:(1)搜集数据:从行情数据源获取训练模型样本的数据特征属性集, 将每一个数据特征属性集看作一个视图;(2)分类标记:所述每一个视图上 利用本视图的分类器进行分类提取并分别对类别进行标注,判断对数据特征 的分类是否完成,若完成,则获得搜集到训练模型样本的所有数据,若未完 成,则等待所有数据分类直至完成;(3)获取训练模型:将每个视图中训练 模型样本搜集到的所有数据拼接成一个矩阵,从而获得每一个视图的预测结 果,若预测结果不满足要求,则转入步骤(2)继续分类,这需同时完成步骤 (2)中分类器的分类提取与类别的标注才算满足,若预测结果满足要求,则 得到每一个类别的分类器,从而最终获得训练模型。本发明首先需要确定预 判写作内容并搜集数据。在步骤(2)中所述的分类器可以为决策树分类器, 其提供一个数据特征属性集,决策树通过在属性集的基础上作出一系列的决 策,将数据分类,这个过程类似于通过一个植物的特征来辨认植物,可以应 用这样的分类器来判定某人的信用程度。
实施例2,实施例1所述的一种基于市场行情数据源的模型训练方法中: 所述步骤(1)的行情数据源为若干不同的数据源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州晨川通信科技有限公司,未经苏州晨川通信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510992078.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理