[发明专利]基于随机森林与朴素贝叶斯模型的内幕交易识别方法在审
申请号: | 201910472108.3 | 申请日: | 2019-05-31 |
公开(公告)号: | CN110210973A | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 邓尚昆;王晨光;曹成航 | 申请(专利权)人: | 三峡大学 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04 |
代理公司: | 宜昌市三峡专利事务所 42103 | 代理人: | 成钢 |
地址: | 443002 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交易识别 随机森林 贝叶斯 贝叶斯模型 特征指标 样本数据 最优解 交易 构建 测试目标 模型筛选 拟牛顿法 时间窗口 遗传算法 鲁棒性 求解 筛选 验证 股票 更新 监管 优化 | ||
本发明公开了一种基于随机森林与朴素贝叶斯模型的内幕交易识别方法,该方法获取不同时间窗口期下的内幕交易样本数据集,采用随机森林模型筛选构建特征指标集,根据筛选出的特征指标集构建内幕交易的贝叶斯识别模型,采用贝叶斯识别模型进行内幕交易识别,得出是否内幕交易的结果;事后监管验证内幕交易识别结果是否正确,并根据识别结果对贝叶斯识别模型进行训练更新。本发明建立了股票内幕交易识别模型,实现了对测试目标是否进行内幕交易的准确识别;结合拟牛顿法和遗传算法,使随机森林模型的参数快速、高精度地优化到最优解,最优解的求解对初始值的依赖性小;本发明易于实现,性能稳定,且随着样本数据增加,鲁棒性、准确性会进一步提高。
技术领域
本发明属于证券市场监管领域,具体涉及一种基于随机森林与朴素贝叶斯模型的内幕交易识别方法。
背景技术
证券市场内幕交易行为严重干扰了股市的正常运行,尤其损害了中小投资者利益。近年来,如何识别内幕交易已经成为了学术界关注的热点。
朴素贝叶斯分类器与其它分类器相比,是学习效率、分类效果较好的分类器之一,其优势为算法逻辑简单、易于实现、算法性能稳定等。朴素贝叶斯分类的基础是概率推理,已知各条件出现的概率,完成推理和决策任务。
遗传算法是一种搜索优化算法,它主要模拟了生物遗传学和自然选择的机理。遗传算法具有强大的全局搜索能力,起始搜索速度很快,在解决复杂和状态多变的优化问题方面很有优势,但遗传算法后期寻优速度较慢,并且寻优结果较难达到理想的精度。
随机森林是一个包含多个决策树的分类器,其输出的分类结果是由个别树输出的结果的综合判断,其不仅克服了大量参数的选择问题、拥有较高的鲁棒性,而且具有可评估特征重要性、不易出现过拟合、与可快速准确处理大量数据的优点。
因此,对遗传算法进行改进,研究一种结合随机森林算法、朴素贝叶斯分类器的内幕交易识别方法。
发明内容
本发明的技术问题是证券市场的内幕交易行为严重干扰了股市的正常运行,损害了投资者利益,不易被识别;本发明的目的是针对此技术问题,提供一种基于随机森林与朴素贝叶斯模型的内幕交易识别方法,结合拟牛顿法和遗传算法对随机森林模型的参数进行优化后,采用随机森林模型筛选构建最优特征指标集,然后通过构建朴素贝叶斯模型对证券市场股票是否发生内幕交易予以快速识别。
本发明的技术方案是基于随机森林与朴素贝叶斯模型的内幕交易识别方法,具体步骤如下,
步骤1:获取不同事件时间窗口期下的内幕交易样本数据集;
步骤2:采用随机森林模型筛选构建特征指标集;
步骤3:根据筛选出的特征指标集构建内幕交易的贝叶斯识别模型;
步骤4:获取测试目标并构建测试目标数据集;
步骤5:采用贝叶斯识别模型进行内幕交易识别,得出是否内幕交易的结果;
步骤6:事后监管验证内幕交易识别结果是否正确;
步骤6.1:若事后监管验证内幕交易识别结果正确,则执行步骤8;
步骤6.2:若事后监管验证内幕交易识别结果不正确,则执行步骤7;
步骤7:将测试目标数据集及是否内幕交易的结果加入样本数据集并训练更新贝叶斯识别模型;
步骤8:判断是否有下一测试目标;
步骤8.1:若有下一测试目标,则执行步骤4;
步骤8.2:若没有下一测试目标,则结束。
所述步骤2中,所述随机森林算法的参数采用拟牛顿法结合遗传算法的寻优方法确定,拟牛顿法结合遗传算法的寻优方法包括如下步骤,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三峡大学,未经三峡大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910472108.3/2.html,转载请声明来源钻瓜专利网。