[发明专利]一种基于主成分分析法和Q聚类分析的科创板拟上市企业估值模型在审
申请号: | 201911266323.4 | 申请日: | 2019-12-11 |
公开(公告)号: | CN111402041A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 文传军;夏红卫;卢杰;舒继增;裴昌富 | 申请(专利权)人: | 常州工学院 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06K9/62 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 王昊 |
地址: | 213032 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 成分 分析 聚类分析 科创板拟 上市 企业 模型 | ||
1.一种基于主成分分析法和Q聚类分析的科创板拟上市企业估值模型,其特征按如下步骤进行:
步骤1:建模基本假设及模型符号说明
步骤1.1模型假设建立
适当的假设有利于模型准确有效的描述科创板拟上市企业估值情况;
(1)大量数据符合平均分布的统计规律,能反映整体的估值水平;
(2)估值水平仅受基本面指标和流动性指标的影响,其它因素不影响其结果;
(3)所有统计的数据真实可信且抽样样本能够反映整体的特征;
步骤1.2建模符号说明
为了建模的需要,对相关符号进行说明,如下表所示:
w:代表中国A股市场的总股本;
s:表示美国NASDAQ市场的总股本;
表示平均市销率;
代表中国A股市场的平均市销率;
表示美国NASDAQ市场的平均市销率;
αi(i=1,2,…,n):第i个企业的市销率;
wi(i=1,2,…,n):第i个企业的年成交量(股);
x1…x6分别表示营业收入、归母净利润、净资产收益率、单只股票交易量、单只股票平均换手率、单只股票交易金额;
n表示2009、2010…2018年;
第i年x1,x2,x3,…x10的取值分别记作[ai1,ai2,…ai10];
步骤2:基于平均市销率评估2018年中国A股市场与美国NASDAQ市场的估值水平
选取平均市销率作为估值水平,测算2018年中国A股市场与美国NASDAQ市场的估值水平,并计算出这两个市场的估值溢价或折价水平;
结合2018年中国A股市场与美国NASDAQ市场的市销率和总股本计算平均市销率用来作为估值水平,在计算的过程中,可以得到中国A股市场和美国NASDAQ市场的估值水平,通过平均市销率来比较两个市场的估值水平,并判断出中国A股市场和美国NASDAQ市场在总市场下的估值溢价或折价水平;
根据网络数据求出平均市销率,用于衡量2018年中国A股市场和美国NASDAQ市场的估值水平,同时计算两个市场的估值溢价或者折价水平;
(一)首先使用加权平均法计算平均市销率
其公式如(1)所示:
①得到总平均市销率为:
②得到2018年中国A股市场的估值水平
③得到美国NASDAQ市场的估值水平
(二)其次由第一步数据可以知道2018年中国A股市场和美国NASDAQ市场的估值水平:
因为3.69<6.52,所以得到2018年中国A股市场的估值水平较低;因为28.14>6.52,所以得到2018年美国NASDAQ市场的估值水平较高;
(三)通过这两个市场的估值水平计算出估值溢价或折价水平,公式如(2)所示:
中国A股市场的折价水平为:
美国NASDAQ市场的估值溢价为:
步骤3:中国A股市场的估值指标与美国NASDAQ市场的估值指标定量分析
对中国A股市场的估值指标与基本面指标、流动性指标之间的关系进行定量分析,同时对美国NASDAQ市场的估值指标与基本面指标、流动性指标之间的关系进行定量分析,并比较差异;其中,基本面指标包括年度营业收入、年度归母净利润、年度净资产收益率等;流动性指标包括年度单只股票交易量、年度单只股票交易金额、年度单只股票平均换手率等;
根据网络提供数据,计算出基本面指标、流动性指标中年度营业收入、年度归母净利润、年度净资产收益、年度单只股票交易量、年度单只股票交易金额和年度单只股票平均换手率的均值,由于影响的指标较多,所以需要筛选出影响估值指标较大的因素,由此考虑运用主成分分析法求解出贡献率作为权重;
基于主成分分析法的估值指标定量分析
根据网络提供数据,计算出基本面指标、流动性指标中年度营业收入、年度归母净利润、年度净资产收益、年度单只股票交易量、年度单只股票交易金额和年度单只股票平均换手率的均值,考虑到影响的指标较多,所以需要筛选出影响估值指标较大的因素,由此想到运用主成分分析法求解出贡献率作为权重;
运用主成分分析法步骤如下:
(1)首先分别将第i年x1,x2…x10的取值[ai1,ai2,…ai10],构造出矩阵A=(aij)10×6;
(2)然后对原始数据进行求平均值处理;
(3)其次对上表中的数据再进行标准化处理,将各指标值aij转换成标准化指标得到
注:即μj,sj为第j个指标的样本均值和样本的标准差;
相对应的,称
为标准化指标变量;
(4)接着计算相关系数矩阵R;相关系数矩阵R=(rij)6×6,得到
注:r11=1;rij=rji,rij为第i个指标和第j个指标的相关系数;
(5)计算特征值和特征向量;计算相关系数矩阵R的特征值λ1≥λ2≥…≥λ6≥0,和对应的标准化特征向量c1,c2,…,c6;
其中,cj=[c1j,c2j,…,c6j]T,由特征向量组成6个新的指标变量
…
注:y1为第一主成分;y2为第二主成分;…;y6为第六主成分;
(6)选择p(p≤6)个主成分,计算综合评价值;
i.计算特征值λj的信息贡献率和累积贡献率;称
为主成分yj的信息贡献率,称
为主成分y1,y2…yp的累积贡献率;当μp接近于1时,就选择前p个指标变量作为主成分代替原始6个指标变量,对这p个主成分进行综合分析;
ii.计算综合得分:
注:bj是第j个主成分的信息贡献率;
利用MATLAB软件求得的相关系矩阵的前六个特征根及贡献率;前三个特征根的累计贡献率就达到96%以上,此时主成分效果很好,于是就选取这三个主成分进行综合评价这三个主成分的特征根对应的特征向量:
由此得到三个主成分分别为:
分别以三个主成分的贡献值为权重,来构建主成分综合评价模型:
Z=0.6038y1+0.2297y2+0.1311y3
接着,把各个年度的三个主成分值代入上式,就可以得到各年度的排名和综合评价的结果,
这样就得出了中国A股市场的所需结果了,然后按照上述中国数据处理的方法对美国NASDAQ股市进行同样的处理方法
美国NASDAQ市场的主成分综合评价模型:
Z=0.6020y1+0.1641y2+0.1479y3
下面需要对中国A股市场的数据进行载荷处理,其公式如下:
分析:
1)第一主成分z1与呈显出的较强的正相关,与呈显出的较强的负相关;而这几个变量综合代表了基本面指标的状况,因此,可以认为第一主成分z1是基本面指标的代表;
2)第二主成分z2与呈显出的较强的正相关,与呈显出的较强的负相关;而这几个变量综合代表了流动性指标的状况,因此,可以认为第二主成分z2是流动性指标的代表;
3)第三主成分z3与呈显出的较强的正相关,与呈显出的较强的负相关;而这几个变量综合代表了基本面指标的状况,因此,可以认为第二主成分z3是基本面指标的代表;
综上:目前可以明确的得出中国A股市场的估值指标与年度营业收入、年度归母净利润和年度单只股票平均换手率有明显的正相关;
同理,可以算出美国NASDAQ数据的载荷数据:
根据上述数据,可以得出美国NASDAQ的估值指标与年度营业收入、年度归母净利润和年度单只股票交易金额有明显正相关;
最终得出结论:
相同点:受年度营业收入、年度归母净利润这两个指标影响较大;
差异:中国A股市场的估值指标受年度单只股票平均换手率的影响较大,而美国NASDAQ的估值指标受年度单只股票交易金额影响较大;
将各指标aij转化成标准化指标即
其中:即μj、sj第j个指标的样本均值和样本标准差;对应地,称
为标准化指标变量;
步骤4:基于ARIMA模型的中国A股市场和美国NASDAQ市场2019年估值指标预测;
需要根据前10年的中国A股市场以及美国NASDAQ市场的数据分别进行数据处理,考虑到两国市场从2009年至2018年的数据具有一定的趋势性、季节性以及非平稳性,由此想到运用ARIMA序列进行预报,可以得到2019年的所需数据;
依据上述分析,ARIMA模型如下:
(1)设{Xt,t=0,±1,…}是ARIMA(p,d,q)序列:
①当d=1时,此时有:
即
由此得到:
②当d=2时,即
接着复原可得
在MATLAB中输入程序,中国A股市场各指标的预测值计算结果:
接着,使用回归分析模型中的多元非线性回归对该三个主成分和估值指标之间的具体关系进行确定,以中国A股市场数据为例,经过估值指标分别与其三个主成分的图像趋势大致可以观察出二者之间的函数关系,进而得到各自的函数通式:
把表12的数据代入上述通式,最终得到中国A股市场的估值指标与其三个主成分的函数为:
通过上述公式,结合数据计算出2019年中国A股市场的估值指标为10.43
同理,得出美国NASDAQ市场的函数通式为:
最终得到中国A股市场的估值指标与其三个主成分的函数为:
y=2.7218+0.0001x6
通过上述公式,结合数据计算出2019年美国NASDAQ市场的估值指标为118.4518
步骤5:基于Q型聚类分析的估值量化模型;
因为所给的公司数据量很大,混杂多变,所以可以将这些数据分门别类的进行研究,为了让这些混杂多变的数据集合更加清晰明了细致,由此可以引进聚类分析模型里的Q型聚类分析;假设Ω={w1,w2,…w7},其步骤如下:
1.计算1000个公司数据两两之间的相似度|dij|,记为矩阵D=(dij)1000×1000;
2.首先构造1000个类,每一类只包含一个公司的数据,每一类的平台高度都设定为0;
3.其次合并距离最近的两个公司作为一个新类,并且以这两类间的相似度的值作为聚类图里的平台高度;
4.接着计算新类和当前各类的相似度,如果类的个数已经等于1,那么转入步骤(5),否则回到步骤(3);
5.画聚类图;
6.最后决定类的个数和类;
显然易见,这种系统归类的过程和计算类与类之间的相似度有关,采用不同的相似度定义,有可能得出不同的聚类结果;
最终用平均加权法计算出两类的估值水平分别为4.75、1.04,选取值较大的作为参照标准;然后用相同的方法计算2018年中国A股市场的估值水平,选取与已算出的美国的估值水平相近的值作为中国该年的估值水平;
最后,我们预测我国首批科创板企业上市后的估值水平;
模型如下:
设观测序列y1,…,yT,取移动平均的项数N<T;计算公式为:
计算公式为:
当预测目标的基本趋势是在某一水平上下波动时,建立预测模型,即
其预测标准误差为:
最近N期序列值的平均值作为未知各期的预测结果;选择最佳N值的一个有效方法是,比较若干模型的预测误差,预测标准误差最小者为好;
当预测目标的基本趋势与某一线性模型相吻合时,但序列同时存在线性趋势与周期波动时,可用趋势来预测模型:
式中:
由上述模型,运用MATLAB程序运算出我国首批科创板93家企业上市后的总市值
因为结果需要我们对我国首批科创板企业上市后的估值水平进行了预测,得到了93家科创板企业的市值,根据它们上市后每个公司发行的股票支数\总股本,可以计算出单只股票的价格;
根据上述计算出的结果,与它发行的价格进行对比,如果高于发行价格,则买进;如果低于发行价格,就不选择买进。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州工学院,未经常州工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911266323.4/1.html,转载请声明来源钻瓜专利网。