[发明专利]一种基于机器学习算法的数据分类、数据处理方法及设备在审
申请号: | 201811133198.5 | 申请日: | 2018-09-27 |
公开(公告)号: | CN109360052A | 公开(公告)日: | 2019-02-19 |
发明(设计)人: | 陈万康;王文婕 | 申请(专利权)人: | 北京亚联之星信息技术有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q40/00;G06K9/62 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云 |
地址: | 100088 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 报价数据 金融业务 数据分类 业务类型 报价 基于机器 学习算法 数据处理 保证系统 接收用户 明确标识 数据样本 特征向量 系统平台 用户提供 用户体验 主观认识 标注 样本 分类 发布 申请 | ||
1.一种基于机器学习算法的数据分类方法,其特征在于,包括:
接收用户输入金融业务的报价数据;
对所述报价数据进行处理,得到处理结果;
根据数据分类模型和所述处理结果,确定所述金融业务报价对应的业务类型,所述数据分类模型基于标注过的报价数据样本的特征向量训练得到。
2.根据权利要求1所述的数据分类方法,其特征在于,对所述报价数据进行处理,包括:
对所述报价数据进行分词处理,得到所述报价数据的特征向量。
3.根据权利要求2所述的数据分类方法,其特征在于,根据数据分类模型和所述处理结果,确定所述金融业务报价对应的业务类型,包括:
根据所述特征向量和所述数据分类模型中包含的分类算法,确定所述金融业务报价对应的业务类型。
4.根据权利要求1所述的数据分类方法,其特征在于,通过以下方式训练得到数据分类模型:
获取数据样本,并确定各所述数据样本的特征向量,所述数据样本中包含金融业务的报价数据;
确定模型训练算法,所述模型训练算法中包含用于分类的算法;
根据所述模型训练算法、各所述数据样本的特征向量和预先设定的分类信息,训练得到数据分类模型,所述数据分类模型用于对输入的金融业务报价进行分类。
5.根据权利要求4所述的数据分类方法,其特征在于,确定各所述数据样本的特征向量,包括:
针对各所述数据样本,分别执行以下操作:
选择其中一个数据样本,对该数据样本进行分词处理;
统计该数据样本对应的词频;
基于所述词频得到该数据样本的特征向量。
6.根据权利要求4所述的数据分类方法,其特征在于,根据所述模型训练算法、各所述数据样本的特征向量和预先设定的分类信息,得到数据分类模型,包括:
将各所述数据样本的特征向量和预先设定的分类信息作为输入数据,利用所述模型训练算法,对该输入数据执行训练操作,得到数据分类模型;
所述数据分类模型中包含用于分类的模型参数。
7.根据权利要求4所述的数据分类法,其特征在于,所述模型训练算法包含朴素贝叶斯分类算法。
8.一种基于机器学习算法的数据处理方法,其特征在于,包括:
获取数据样本,并确定各所述数据样本的特征向量,所述数据样本中包含金融业务的报价数据;
确定模型训练算法,所述模型训练算法中包含用于分类的算法;
根据所述模型训练算法、各所述数据样本的特征向量和预先设定的分类信息,训练得到数据分类模型,所述数据分类模型用于对输入的金融业务报价进行分类。
9.一种基于机器学习算法的数据分类设备,其特征在于,包括:
接收单元,用于接收用户输入金融业务的报价数据;
处理单元,用于对所述报价数据进行处理,得到处理结果;
分类单元,用于根据数据分类模型和所述处理结果,确定所述金融业务报价对应的业务类型,所述数据分类模型基于标注过的报价数据样本的特征向量训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京亚联之星信息技术有限公司,未经北京亚联之星信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811133198.5/1.html,转载请声明来源钻瓜专利网。