[发明专利]一种基于人工智能算法的相似上市企业检索分类方法及系统在审
申请号: | 202010550600.0 | 申请日: | 2020-06-16 |
公开(公告)号: | CN111782806A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 薛逢源 | 申请(专利权)人: | 上海简答数据科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/279;G06Q40/06;G06Q40/00 |
代理公司: | 上海大为知卫知识产权代理事务所(普通合伙) 31390 | 代理人: | 何银南 |
地址: | 200000 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 算法 相似 上市 企业 检索 分类 方法 系统 | ||
本发明公开了一种基于人工智能算法的相似上市企业检索分类方法及系统,属于金融分析、评估领域,该方法根据标的企业与相关企业的财务报表,主营业务,财务指标,商业周期敏感程度,以及统计相关程度结合的方式,结合当前主流的机器学习算法构建人工智能模型,深入挖掘提取出与标的公司财务指标相似的公司,并对相关联的企业进行相似度排名,以找出对标企业,并提取出每个公司对应的上市相似的公司集群及其财务指标,为投资研究提供数据基础。本发明有效地解决了传统的数据覆盖面不全和传统的对标企业检索系统的数据不准确以及实用性不强的问题。
技术领域
本发明属于金融分析、评估技术领域,具体涉及一种基于人工智能算法的相似上市企业检索分类方法及系统。
背景技术
在金融投资领域中,投资者需要对标的企业进行详细的业务分析,财务分析,以及合理的企业价值估值。对于标的公司的研究,经常需要有同行业或同领域竞争公司的企业经营数据做参考分析,使用余弦距离与欧氏距离等算法构建的人工智能模型,可找出与标的公司财务指标相似的上市公司,以预测该公司的预期财务指标数据,发现潜在的投资标的。常用的寻找相似公司方式,主要是通过已有的行业分类模型,如全球行业分类标准、罗素全球行业、行业分类基准等投资性分类系统,以及国民经济行业分类、上市企业行业分类等管理型政府行业分类系统。由于新兴技术的不断进步,多领域多行业交融的公司企业相继涌现,传统的分类方式很难满足市场现有的需求。
现有的查找相似公司的多是基于文本检索的方式,如搜集上市公司的招股说明书、年度报告、重要公告、财务报告、行业研究报告、专利信息、诉讼信息、招标投标信息和企业重要新闻等,使用文本分析检索、知识库推理、关键词提取等技术来进行公司相似度分类,此种方法并没有真正触及到上市公司的核心数据——财务数据,数据覆盖面不全、实用性较差、数据不准确。
发明内容
本发明的目的在于提供一种基于人工智能算法的相似上市企业检索分类方法及系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于人工智能算法的相似上市企业检索分类方法,该方法包括如下步骤:
S1、获取上市企业的财务季度报表和财务年度报表数据;
S2、将获取的数据按照标题的公告分类,经过处理后进行分类存储;
S3、将财务数据存储后针对每家上市企业的财务数据及指标通过人工智能模型进行结构分析及计算,并对财务指标进行存储;
S4、从财务数据和财务指标数据中提出数据,进行财务特征值计算;
S5、利用分布式检索引擎技术对结构化处理后的数据建立空间向量模型,根据数据集合类型选择公司距离矩阵的计算方法计算得出公司距离矩阵;
S6、根据公司距离矩阵,设置数据阀值,提取出各个公司的相似公司距离矩阵,生成公司相似度矩阵。
优选的,所述S2中,标题的公告分类通过选择合适的分类算法构建分类模型,提炼语料训练集并使用分类模型对每篇公告进行精准分类。
优选的,所述分类算法包括KNN算法、聚类算法、决策树算法、朴素贝叶斯算法和Rocchio算法。
优选的,所述S2中,分类处理包括如下步骤:
S21、PDF文件解析;
S22、财务报表定位;
S23、表格识别;
S24、表格语义解析。
优选的,所述S3中,人工智能模型包括全面的财务指标算法,可根据不同维度的财务指标自动化匹配有针对性的财务指标算法,并在计算完成后对现有数据进行清洗检测,去掉重复数据和冗余数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海简答数据科技有限公司,未经上海简答数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010550600.0/2.html,转载请声明来源钻瓜专利网。