感情贴16牛腩木耳卷饼A股指数聚类

姜禄彬

个人o

.6.26

前·言

写研究报告是一件需要内心很平静的事情。彼得.伯恩斯坦在他杰出著作《投资革命》里面讲道,《计量经济》杂志(Econometrica)是由研究股票的考尔斯三世于年赞助创刊,诺贝尔经济学获奖者托宾、马科维茨都获得了这个杂志的研究资助,考尔斯三世讨论了一些重要问题,例如年发表的,运用计量经济学所写的文章“股票预测指标能够准确预测么?”就是一篇非常有价值的研究报告。几十年以后,FAMA-French三因子模型就是在这个基础上又前进了一步。

FAMA本人在Tufts大学时曾为HarryErnst教授工作赚钱。HarryErnst当时出版一份股市投资通讯,主要是根据股票的价格动能(momentum)挑选股票。不过,趋势一旦形成必将持续的观点,旋即被麻省理工经济学家亚历山大(SidneyAlexander)推翻了。FAMA的工作则是根据厄内斯特的分析系统,找出有效的买卖讯号。与亚历山大不同的是,FAMA没有电脑协助他执行繁琐的工作,他只能用装有手动曲柄的Monroe计算机以及削尖的铅笔划出股价线图。

FAMA后来认为的三因子是低估值、小公司和市场风险。然而在A股投资中,由于我们需要一直满仓持有,并且大公司具备更加竞争力,因此真正在A股投资风格上拉开差距的,其实主要是低估值和动量因子。我后来也有三年时间曾经绘制铅笔股价线图,也明白了动量因子其实是有效的,弗朗西斯科.帕拉梅斯在《长期投资》中指出这种动量因子必须符合奥地利经济学派里关于经济增长的定义,也就是今天所说的赛道投资。

无论如何,像医药、食品饮料、芯片等重要A股行业是站在枢纽上,这些领域即使数年里陷于低迷,也总会有机会,这是公募基金以此为基础发行赛道型基金的原因。以前艾伯特.巴拉巴西写了一本书叫做《链接:商业、科学与生活的新思维》,带给了我们一种整体的、关联的、系统论的审视世界的方式,使我们不仅仅将视野局限于孤立的单元。

广泛存在的链接是从简单到复杂、从单一到多样、从平凡到璀璨的桥梁,而研究枢纽需要用到聚类分析的技巧。在这篇文章中,共分为四个部分:前两个部分是对于上证50和沪深分别进行拆解,找出它们的相似之处,第三部分则是讲对于上证50和沪深的拆解;第四部分是对于公募医药类基金持仓聚类分析。

生活方面,我最近做了牛腩木耳卷饼,虽然目前做的确实不好吃,能吃完是需要勇气的。但是我的厨艺在提高,只要肯花时间、舍得放好食材就没有问题。证券投研有很多人会忙得分不清工作与生活,但实际上,生活与工作之间有一条明确的分界线,我们要做到能够分清楚。在目前的阶段,不能用战术的勤奋来掩盖战略上的懒惰。当前的主要精力要放在生活上而非工作,不仅是工作可以做到内心平静,生活上也要做到内心平静、沉稳和体贴。如果能够做到后者,这就是我写作证券研究连载的成功之处。

我以前留学时有位成都同学,她把工作和生活都安排的高效且井井有条,习惯于穿紧身浅蓝牛仔裤平底鞋,背一个Coach深蓝挎包,她吃着自己做的沙拉写着作业时,最常说的一句话是“快要来不及啦,快要来不及啦”。她完成学业以后,后来有两个孩子。我也很想跟自己说“快要来不及啦,快要来不及啦。”也许如此,普通的一天将永远在喧闹中变得不再普通。

正·文

目录

第一部分、上证50成分股的聚类分析

第二部分、沪深成分股的聚类分析

第三部分、股票市场数据以及风险和收益的测量(高惠璇《SAS系统与股票市场分析》P1-P14)

第四部分、医药股的聚类分析

·1·

01上证50成分股的聚类分析

现在我们用上证50成分股50家公司年5月6日至年4月30日股价日收益率数据进行聚类分析。原数据格式如下:

为操作方便,现将公司名称改成A1,A2,A3…An,并用0代替缺失值,如下,所以我们知道在处理股票聚类分析时,列数要用A股指数公司的名字:

1.1、导入数据

考虑到数据量限制为*,先导入数据再对数据进行转置操作。现将数据导入SAS中,其中包括数据转置代码。

生成的dcf10数据集部分如下:

1.2、初步分析

1.2.1、产生相关阵

下面的PROCCORR计算50种股价收益率的相关系数,共有(50*50)个相关系数被计算。

结果部分展示如下:

1.2.2、产生距离矩阵

其中生成的dcf10b和dist1数据集部分如下所示。

1.3、聚类分析

1.3.1、最短距离聚类分析

下面使用最短距离法进行聚类分析。

结果:

CL49:华泰证券国泰君安(37中信证券+31海通证券+9中信建投)

CL47:工商银行农业银行(29民生银行+33浦发银行+27光大银行)

CL45:中国石化中国石油

CL43:中国人寿新华保险

CL42:中国平安中国太保

CL38:隆基股份通威股份

CL36:招商银行兴业银行

CL33:保利地产中国建筑

CL30:山东黄金紫金矿业

CL29:贵州茅台山西汾酒

CL27:78韦尔股份兆易创新(10闻泰科技+13三安光电)

CL25:药明康德恒瑞医药(12海天味业)

CL17:三一重工万华化学

CL6:恒生电子用友网络

杂牌:

:中金公司上海机场复星医药上汽集团

46:中国中免伊利股份

:中泰证券海螺水泥中国神华中国联通

23:工业富联

49:航发动力

24:海尔智家

第一类:

CL42+CL43=11中国平安+30中国太保+20中国人寿+22新华保险

第二类:

CL37+CL36=(COL27+CL40)+42招商银行+45兴业银行

=27光大银行+(CL41+COL33)+42招商银行+45兴业银行

=27光大银行+(CL47+COL29)+33浦发银行)+42招商银行+45兴业银行

=27光大银行+(COL28+COL32)+29民生银行+33浦发银行+42招商银行+45兴业银行

=27光大银行+28工商银行+32农业银行+29民生银行+33浦发银行+4招商银行+45兴业银行

第三类:

CL32+CL33=CL34+CL35+26保利地产+36中国建筑

=(CL44+CL39)+(CL37+CL36)+26保利地产+36中国建筑

=(COL9+CL46)+(CL42+CL43)+27光大银行+28工商银行+32农业银行+29民生银行+33浦发银行+4招商银行+45兴业银行+26保利地产+36中国建筑

=9中信建投+(CL48+COL31)+11中国平安+30中国太保+20中国人寿+22新华保险+27光大银行+28工商银行+32农业银行+29民生银行+33浦发银行+4招商银行+45兴业银行+26保利地产+36中国建筑

=9中信建投+(CL49+COL37)+31海通证券+11中国平安+30中国太保+20中国人寿+22新华保险+27光大银行+28工商银行+32农业银行+29民生银行+33浦发银行+4招商银行+45兴业银行+26保利地产+36中国建筑

=9中信建投+(COL25+COL34)+37中信证券+31海通证券+11中国平安+30中国太保+20中国人寿+22新华保险+27光大银行+28工商银行+32农业银行+29民生银行+33浦发银行+4招商银行+45兴业银行+26保利地产+36中国建筑

=9中信建投+25华泰证券+34国泰君安+37中信证券+31海通证券+11中国平安+30中国太保+20中国人寿+22新华保险+27光大银行+28工商银行+32农业银行+29民生银行+33浦发银行+4招商银行+45兴业银行+26保利地产+36中国建筑

第四类:

CL22+CL29=(CL25+COL12)+14贵州茅台+21山西汾酒

=(COL3+COL15)+12海天味业+14贵州茅台+21山西汾酒

=3药明康德+15恒瑞医药+12海天味业+14贵州茅台+21山西汾酒

1.3.2、打印指定数目的类

下面指定限定OUT=数据集中类的个数为5。

输出解释:COL40(上汽集团)、COL2(复星医药)、COL5(上海机场)和COL1(中金公司)各自成一个类,其余公司合并为一类。

·2·

02沪深成分股的聚类分析

现在我们用沪深成分股家公司年7月1日至年6月18日股价日收益率数据进行聚类分析。

原数据格式如下:

为操作方便,现将公司名称改成A1,A2,A3…An,改变公司名称后如下表所示:

2.1、导入数据

考虑到数据量限制为*,先导入数据再对数据进行转置操作。现将数据导入SCOLS中,其中包括数据转置代码。

生成的dcf10数据集部分如下:

2.2、初步分析

2.2.1、产生相关阵

下面的PROCCORR计算种股价收益率的相关系数,共有(*)个相关系数被计算。

结果部分展示如下:

2.2.2、产生距离矩阵

其中生成的dcf10b和dist1数据集部分如下所示。

2.3、聚类分析

2.3.1、最短距离聚类分析

下面使用最短距离法进行聚类分析。

下面画出相应的树形图。

结果

CL中国交建中国铁建

CL华泰证券国泰君安

CL中国东航南方航空

CL中国银行农业银行

CL中金黄金山东黄金

CL泸州老窖五粮液

CL金地集团保利地产

CL长城证券天风证券

CL华夏银行北京银行

CL新华保险中国人寿

CL中国石油中国石化

CL浙商银行渝农银行

CL中国太保中国平安

CL中航沈飞航发动力

CL泰格医药药明康德

CL紫金矿业江西铜业

CL中银证券中泰证券

CL完美世界三七互娱

CL平安银行兴业银行

CL京东方ATCL科技

CL隆基股份通威股份

CL中国卫星中国卫通

CL大参林益丰药房

CL恒力石化荣盛石化

CL通策医疗爱尔眼科

CL歌尔股份立讯精密

CL中国神华山西煤业

CL北方华创中威公司

CL中国广核中国核电

CL正邦科技新希望

CL生益科技沪电股份

CL智飞生物康泰生物

CL190三一重工中联重科

CL鹏鼎控股东山精密

CL璞泰来恩捷股份

CL中科曙光浪潮信息

CL长城汽车比亚迪

CL华鲁恒生万华化学

CL中炬高新海天味业

CL23美的集团海尔智家

CL上汽集团广汽集团

CL海康威视大发股份

CL韵达股份圆通速递

CL中远海控招商轮船

CL上海莱士苏宁易购

CL英科医疗华大基因

CL同仁堂XD白云山

CL中金药业汇川技术

相关组CLCL

CLCL

CLCL

第一类

CL+CL=(COL+CL)+(CL+COL)=(交通银行+CL+COL)+(华夏银行+北京银行+中信银行)=交通银行+(CL+COL)+建设银行+华夏银行+北京银行+中信银行

=交通银行+(COL+COL)+工商银行+建设银行+华夏银行+北京银行+中信银行

=交通银行+中国银行+农业银行+工商银行+建设银行+华夏银行+北京银行+中信银行

第二类

CL+CL=CL+长城证券+天风证券

=(COL+CL)+长城证券+天风证券

=海通证券+(CL+COL)+长城证券+天风证券=海通证券+(COL+CL)+广发证券+长城证券+天风证券=海通证券+中国银河+(CL+COL)+广发证券+长城证券+天风证券=海通证券+中国银河+(CL+COL)+申万宏源+广发证券+长城证券+天风证券=海通证券+中国银河+(COL+COL)+中信证券+申万宏源+广发证券+长城证券+天风证券=海通证券+中国银河+华泰证券+国泰君安+中信证券+申万宏源+广发证券+长城证券+天风证券

第三类

CL+CL=(COL+COL)+(CL+COL)

=新华保险+中国人寿+(CL+COL)+国金证券=新华保险+中国人寿+(CL+COL)+国信证券+国金证券=新华保险+中国人寿+(CL+COL)+华林证券+国信证券+国金证券=新华保险+中国人寿+(CL+COL)+中航资本+华林证券+国信证券+国金证券=新华保险+中国人寿+(CL+COL)+东方证券+中航资本+华林证券+国信证券+国金证券=新华保险+中国人寿+(CL+COL)+西部证券+东方证券+中航资本+华林证券+国信证券+国金证券=新华保险+中国人寿+(CL+COL)+中国人保+西部证券+东方证券+中航资本+华林证券+国信证券+国金证券=新华保险+中国人寿+(CL+COL)+东吴证券+中国人保+西部证券+东方证券+中航资本+华林证券+国信证券+国金证券=新华保险+中国人寿+(COL+CL)+中信建投+东吴证券+中国人保+西部证券+东方证券+中航资本+华林证券+国信证券+国金证券=新华保险+中国人寿+长江证券+(CL+CL)+中信建投+东吴证券+中国人保+西部证券+东方证券+中航资本+华林证券+国信证券+国金证券=新华保险+中国人寿+长江证券+海通证券+中国银河+华泰证券+国泰君安+中信证券+申万宏源+广发证券+长城证券+天风证券+中信建投+东吴证券+中国人保+西部证券+东方证券+中航资本+华林证券+国信证券+国金证券

第四类

CL+CL=(CL+CL)+(COL+COL)

=新华保险+中国人寿+长江证券+海通证券+中国银河+华泰证券+国泰君安+中信证券+申万宏源+广发证券+长城证券+天风证券+中信建投+东吴证券+中国人保+西部证券+东方证券+中航资本+华林证券+国信证券+国金证券+中国太保+中国平安

第五类

CL+CL=(CL+COL)+(COL+COL)

=(CL+COL)+上海银行+浙商银行+渝农银行

=(CL+COL)+光大银行+上海银行+浙商银行+渝农银行

=(CL+COL)+浦发银行+光大银行+上海银行+浙商银行+渝农银行

=(CL+CL)+民生银行+浦发银行+光大银行+上海银行+浙商银行+渝农银行

=交通银行+中国银行+农业银行+工商银行+建设银行+华夏银行+北京银行+中信银行+民生银行+浦发银行+光大银行+上海银行+浙商银行+渝农银行

第六类

CL+CL=(CL+COL)+(COL+COL)

=(COL+COL)+凯莱英+通策医疗+爱尔眼科

=泰格医药+药明康德+凯莱英+通策医疗+爱尔眼科

第七类

CL+CL=(CL+COL)+(CL+CL)

=(COL20+CL)+金科股份+(COL37+CL)+(CL+COL)

=20招商蛇口+(CL+COL52)+金科股份+37杭州银行+(CL+CL)+(COL60+CL)+中国中车

=20招商蛇口+(COL21+COL53)+52万科A++金科股份+37杭州银行+(COL+CL)+(CL+COL)+60中国电建+(CL+COL)+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+(CL+COL)+(CL+COL)+南京证券+60中国电建+(CL+COL94)+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+(COL+COL)+招商银行+(CL+COL)+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+(CL+COL)+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+(CL+COL)+东方财富+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+(CL+COL)+财通证券+东方财富+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+(CL+COL)+红塔证券+财通证券+东方财富+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+(CL+COL)+江苏银行+红塔证券+财通证券+东方财富+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+(CL+CL)+南京银行+江苏银行+红塔证券+财通证券+东方财富+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+(CL+CL)+(CL+COL)+南京银行+江苏银行+红塔证券+财通证券+东方财富+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+交通银行+中国银行+农业银行+工商银行+建设银行+华夏银行+北京银行+中信银行+民生银行+浦发银行+光大银行+上海银行+浙商银行+渝农银行+(CL+COL)+南京银行+江苏银行+红塔证券+财通证券+东方财富+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+交通银行+中国银行+农业银行+工商银行+建设银行+华夏银行+北京银行+中信银行+民生银行+浦发银行+光大银行+上海银行+浙商银行+渝农银行+(CL+COL)+招商证券+南京银行+江苏银行+红塔证券+财通证券+东方财富+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+交通银行+中国银行+农业银行+工商银行+建设银行+华夏银行+北京银行+中信银行+民生银行+浦发银行+光大银行+上海银行+浙商银行+渝农银行+(CL+COL)+国元证券+招商证券+南京银行+江苏银行+红塔证券+财通证券+东方财富+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+交通银行+中国银行+农业银行+工商银行+建设银行+华夏银行+北京银行+中信银行+民生银行+浦发银行+光大银行+上海银行+浙商银行+渝农银行+(CL+COL)+光大证券+国元证券+招商证券+南京银行+江苏银行+红塔证券+财通证券+东方财富+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+交通银行+中国银行+农业银行+工商银行+建设银行+华夏银行+北京银行+中信银行+民生银行+浦发银行+光大银行+上海银行+浙商银行+渝农银行+(CL+CL)+国投资本+光大证券+国元证券+招商证券+南京银行+江苏银行+红塔证券+财通证券+东方财富+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+交通银行+中国银行+农业银行+工商银行+建设银行+华夏银行+北京银行+中信银行+民生银行+浦发银行+光大银行+上海银行+浙商银行+渝农银行+(COL+CL)+新华保险+中国人寿+长江证券+海通证券+中国银河+华泰证券+国泰君安+中信证券+申万宏源+广发证券+长城证券+天风证券+中信建投+东吴证券+中国人保+西部证券+东方证券+中航资本+华林证券+国信证券+国金证券+中国太保+中国平安+国投资本+光大证券+国元证券+招商证券+南京银行+江苏银行+红塔证券+财通证券+东方财富+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+交通银行+中国银行+农业银行+工商银行+建设银行+华夏银行+北京银行+中信银行+民生银行+浦发银行+光大银行+上海银行+浙商银行+渝农银行+浙商证券+中银证券+中泰证券+新华保险+中国人寿+长江证券+海通证券+中国银河+华泰证券+国泰君安+中信证券+申万宏源+广发证券+长城证券+天风证券+中信建投+东吴证券+中国人保+西部证券+东方证券+中航资本+华林证券+国信证券+国金证券+中国太保+中国平安+国投资本+光大证券+国元证券+招商证券+南京银行+江苏银行+红塔证券+财通证券+东方财富+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车

第八类

CL+CL=(CL+COL95)+(COL33+COL55)

=(CL+COL87)+95中国中治+33中国广核+55中国核电

=(CL+COL)+87邮储银行+95中国中治+33中国广核+55中国核电

=(CL+CL)+87邮储银行+95中国中治+33中国广核+55中国核电

=20招商蛇口+21金地集团+53保利地产+52万科A+金科股份+37杭州银行+宁波银行+平安银行+兴业银行+招商银行+交通银行+中国银行+农业银行+工商银行+建设银行+华夏银行+北京银行+中信银行+民生银行+浦发银行+光大银行+上海银行+浙商银行+渝农银行+浙商证券+中银证券+中泰证券+新华保险+中国人寿+长江证券+海通证券+中国银河+华泰证券+国泰君安+中信证券+申万宏源+广发证券+长城证券+天风证券+中信建投+东吴证券+中国人保+西部证券+东方证券+中航资本+华林证券+国信证券+国金证券+中国太保+中国平安+国投资本+光大证券+国元证券+招商证券+南京银行+江苏银行+红塔证券+财通证券+东方财富+同花顺+兴业证券+南京证券+60中国电建+92中国交建+中国铁建+94中国中铁+中国建筑+中国中车+87邮储银行+95中国中治+33中国广核+55中国核电

第九类

CL+CL=(CL+COL12)+6璞泰来+30恩捷股份

=(CL+CL)+12中国巨石+6璞泰来+30恩捷股份

=(CL+COL99)+(CL+COL)+12中国巨石+6璞泰来+30恩捷股份

=(CL+CL)+99三花智控+(CL+CL)+龙蟒佰利+12中国巨石+6璞泰来+30恩捷股份

=(CL+COL96)+(CL+COL93)+99三花智控+(CL+COL)+华鲁恒生+万华化学+龙蟒佰利+12中国巨石+6璞泰来+30恩捷股份

=(CL+COL)+96浙江龙盛+(CL+COL98)+93韦尔股份+99三花智控+19恒力石化+90荣盛石化+恒逸石化+华鲁恒生+万华化学+龙蟒佰利+12中国巨石+6璞泰来+30恩捷股份

=(COL14+CL)+万泰生物+96浙江龙盛+(CL+COL)+98汇顶科技+93韦尔股份+99三花智控+19恒力石化+90荣盛石化+恒逸石化+华鲁恒生+万华化学+龙蟒佰利+12中国巨石+6璞泰来+30恩捷股份

=14天坛生物+(CL+COL)+万泰生物+96浙江龙盛+(CL+COL)+中兴通讯+98汇顶科技+93韦尔股份+99三花智控+19恒力石化+90荣盛石化+恒逸石化+华鲁恒生+万华化学+龙蟒佰利+12中国巨石+6璞泰来+30恩捷股份

=14天坛生物+(COL+CL)+华兰生物+万泰生物+96浙江龙盛+(CL+COL82)+中天科技+中兴通讯+98汇顶科技+93韦尔股份+99三花智控+19恒力石化+90荣盛石化+恒逸石化+华鲁恒生+万华化学+龙蟒佰利+12中国巨石+6璞泰来+30恩捷股份

=14天坛生物+沃森生物+智飞生物+康泰生物+华兰生物+万泰生物+96浙江龙盛+(CL+CL)+82闻泰科技+中天科技+中兴通讯+98汇顶科技+93韦尔股份+99三花智控+19恒力石化+90荣盛石化+恒逸石化+华鲁恒生+万华化学+龙蟒佰利+12中国巨石+6璞泰来+30恩捷股份

=14天坛生物+沃森生物+智飞生物+康泰生物+华兰生物+万泰生物+96浙江龙盛+(CL+COL)+(CL+CL)+82闻泰科技+中天科技+中兴通讯+98汇顶科技+93韦尔股份+99三花智控+19恒力石化+90荣盛石化+恒逸石化+华鲁恒生+万华化学+龙蟒佰利+12中国巨石+6璞泰来+30恩捷股份

=14天坛生物+沃森生物+智飞生物+康泰生物+华兰生物+万泰生物+96浙江龙盛+(CL+COL)+澜起科技+(CL+COL)+(CL+COL)+82闻泰科技+中天科技+中兴通讯+98汇顶科技+93韦尔股份+99三花智控+19恒力石化+90荣盛石化+恒逸石化+华鲁恒生+万华化学+龙蟒佰利+12中国巨石+6璞泰来+30恩捷股份

=14天坛生物+沃森生物+智飞生物+康泰生物+华兰生物+万泰生物+96浙江龙盛+(CL+COL58)+三安光电+澜起科技+(CL+COL)+紫光股份+生益科技+沪电股份+深南电路+82闻泰科技+中天科技+中兴通讯+98汇顶科技+93韦尔股份+99三花智控+19恒力石化+90荣盛石化+恒逸石化+华鲁恒生+万华化学+龙蟒佰利+12中国巨石+6璞泰来+30恩捷股份

=14天坛生物+沃森生物+智飞生物+康泰生物+华兰生物+万泰生物+96浙江龙盛+(CL+COL)+58兆易创新+三安光电+澜起科技+97中科曙光+浪潮信息+中国长城+紫光股份+生益科技+沪电股份+深南电路+82闻泰科技+中天科技+中兴通讯+98汇顶科技+93韦尔股份+99三花智控+19恒力石化+90荣盛石化+恒逸石化+华鲁恒生+万华化学+龙蟒佰利+12中国巨石+6璞泰来+30恩捷股份

=14天坛生物+沃森生物+智飞生物+康泰生物+华兰生物+万泰生物+96浙江龙盛+(CL+COL63)+华润微+58兆易创新+三安光电+澜起科技+97中科曙光+浪潮信息+中国长城+紫光股份+生益科技+沪电股份+深南电路+82闻泰科技+中天科技+中兴通讯+98汇顶科技+93韦尔股份+99三花智控+19恒力石化+90荣盛石化+恒逸石化+华鲁恒生+万华化学+龙蟒佰利+12中国巨石+6璞泰来+30恩捷股份

=14天坛生物+沃森生物+智飞生物+康泰生物+华兰生物+万泰生物+96浙江龙盛+(CL+COL)+63沪硅产业+华润微+58兆易创新+三安光电+澜起科技+97中科曙光+浪潮信息+中国长城+紫光股份+生益科技+沪电股份+深南电路+82闻泰科技+中天科技+中兴通讯+98汇顶科技+93韦尔股份+99三花智控+19恒力石化+90荣盛石化+恒逸石化+华鲁恒生+万华化学+龙蟒佰利+12中国巨石+6璞泰来+30恩捷股份

=14天坛生物+沃森生物+智飞生物+康泰生物+华兰生物+万泰生物+96浙江龙盛+26北方华创+中威公司+长电科技+63沪硅产业+华润微+58兆易创新+三安光电+澜起科技+97中科曙光+浪潮信息+中国长城+紫光股份+生益科技+沪电股份+深南电路+82闻泰科技+中天科技+中兴通讯+98汇顶科技+93韦尔股份+99三花智控+19恒力石化+90荣盛石化+恒逸石化+华鲁恒生+万华化学+龙蟒佰利+12中国巨石+6璞泰来+30恩捷股份

2.3.2、打印指定数目的类

下面指定限定OUT=数据集中类的个数为5。

部分结果如下:

输出解释:COL(上海机场)、COL(君正集团)、COL10(康弘药业)和COL69(宋城演艺)各自成一个类,其余公司合并为一类。

·3·

03股票市场数据以及风险和收益的测量(高惠璇《SAS系统与股票市场分析》P1-P14)

3.1、简介

本章介绍了股票市场分析的基本概念,讨论了股票市场、股票市场数据以及风险和收益的测量。一般说来,股票市场分析过程应遵循下列步骤:

(1)收集数据;

(2)创建SAS数据集;

(3)股票收益和风险度量的计算;

(4)根据某些金融特征对股票进行排序或聚类;

(5)评估某种股票市场有价证券及其它股票的相关表现;

(6)计算有价证券权重的解值;

(7)决定对哪种有价证券进行投资;

(8)评价你的证券的表现

本章介绍如何运用SAS系统来完成上述分析中的前三步。其余步骤将在后面章节中论述。

3.1.1、硬拷贝数据集

你可以从任何金融数据来源中收集股票数据和金融信息,并进而创建数据集,数据来源包括报纸,杂志,公司报告,经纪公司研究报告,投资服务报告,业务通讯以及政府出版物。

根据分析的目的,你可能会创建时间序数据集(某种股票在不同时间的观测)、横断面数据集(多种股票在某个时刻的观测),以及纵向(时间序列横断面)数据集,也被称之为面板数据集(paneldatasets,它由多种股票在不同时间的观测组成)。

较大报纸的金融栏中通常包含大量的金融信息,包括:股票,股票期权和公共基金行情,债券收益,美国国库债券收益,利率,汇率。

股票在许多不同的交易所中上市。某种股票或共同基金在哪个交易所上市要取决于公司的美元价值、盈利的历史、发行的股票数及其市场价值。最大的公司(根据美元衡量)在纽约股票交易所(NYSE)上市;中等规模的公司在美国股票交易所(AMEX)上市;小公司由全国证券交易商协会自动员行市指数(NASDAQ)列出。交易由证券和交易委员会(SEC)管理。

在较大报纸的金融栏中列出的股票和共同基金行情通常是有下列形式:

这些量的含义如下:

XYZXYZ公司的简称

/8XYZ公司股票的日最高价

48XYZ公司股票的日最低价

/2XYZ公司股票的日收盘价

+5/8表示XYZ公司股票的今日收盘价比上一个交易日高5/8

一些报纸和日杂志也会列出其它信息,包括股份的交易数量,52周的最高价和最低价,根据每股的收益,相对价格盈利的次序,有关价格的易变性量度(relativepricevolatilitymeasures)以及有关价格的获利量度。用硬拷贝形式的数据集可以打入或扫描为SAS数据集。

3.1.2、电子存储的数据集

在SASDATA步中许多软件产生的数据集可以转化为SAS数据集。具体步骤请参阅《SAS系统·BaseSAS软件使用手册》中有关部分。

通过SAS/ETSCITIBASE和DATASOURCE过程,经济和金融数据文件可读入并存储为SAS数据集。PROCDATASOURCE支持的数据文件包括:

美国经济分析局的数据文件;

美国劳工统计局的数据文件;

Stardard&PoorsCompostatServices金融数据库文件;

FAME软件公司的CITIBASE数据文件(磁带格,旧的格式以及PC磁盘格式);

债券价格研究中心(CRSP)的数据文件;

HaverAnalytics数据文件;

国际金融基金的数据文件;

经济合作和发展组织的数据文件。

CITIBASE过程从CITIBASE文件中读入时间序并转化为SAS数据集。注意PROCCITIBASE支持的数据文件为PROCDATASOURCE的子集。PROCCITIBASE可读:

磁带格式的CITIBASE的数据文件;

磁盘格式的CITIBASE的数据文件;

HaverAnalytics数据文件。

关于CITIBASE和DATASOURCE过程的更多信息,请参考《SAS系统·SAS/ETS软件使用手册》。

3.2、单期收益的度量

单期收益的度量包括两部分,从股息(红利)中得到的收入以及由股票的买卖差价得到的资本收入(或损失)。如果你在时刻t-1购买股票的股份,在时刻t卖出,则你获得的收益为买入价()与卖出价()的差价以及红利(Dt)。收益可以由美元收入或其对投资额的百分比来衡量。

于是,第i种股票在第t阶段的股票收益(Ri,t)可计算如下(不计佣金和其它经纪公司的收费):

当你预计某种股票的价格会下落时,你可以卖掉它,即使你并非实际拥有该股票。这种类型的交易称之为卖空。一般说,股票经纪人提供卖空所要的股票,但需要抵押。当你认为股票价格跌至最低点时,你就可以以比较低的价格买进,卖空所得的收益可以利用前面的公式计算。

3.2.1、引入SP1数据集

SP1数据集包含了从年到9年的(SP)个总和股票指数,其中~年等于10,股票的红利为指数形式,注意股票的指数为某些杰出股票的美元值的加权平均。

3.2.1.1、创建SP1数据集

下面的DATA步创建数集SP1,并对变量加标签。

句法说明:

①DATAdata-set-name(DATA数据集名)—DATA步的开始,并创建名为data-set-name的SAS数据集。该例中数据集的名字为SP1。

②INPUT-读输入数据,创建并命名SAS变量。在例中,INPUT语句读入SP,并创建变量V(年终的指数值)和D(股息或红利)。双尾符@@表示每个数据行包含多个观测。

③LABEL—对变量加标签。

④CARDS—表示下面为数据行,数据行后面的分号使得DATA步的语句组得以执行。

3.2.1.2、打印输出SP1数据集

可以PRINT过程打印SP1中的变量,下面的语句打印前5个观测,输出结果见输出1.1。

输出1.1SP1数据集的前5个观测

句法说明:

①PROCPRINT——调用PRINT过程,以下是PROCPRINT语句中制定的选项:

DATA=指定打印的数据集,该例中为SP1,OBS=n指定只打印前n个观测,在该例中,n=5即打印前5个观测。

LABEL规定输出变量的标签

②VAR—指定需打印的变量。

③TITLE—为输出加标题,在该例中,使用了2个标题;但是,你可以使用10个标题语句。在交互式SAS会话中,TITLE语句在改变之前或SAS会话结束之前一直有效。

输出解释:在输出1.1中变量YEAR、V、D的前5个观测被打印。通过打印数据集,你可以检查输入值中的编码错误及观测的正确个数。

3.2.2、绘制SP1数据集的图形

在分析时间序列数据集时,绘制数据对时间的图形通常为第一步。可以用PLOT过程来产生散点图。下面的语句分别绘制了SP指数值和红利值对时间(单位为年)的散点图,输出结果见输出1.2。

句法说明:

(1)PROCPLOT——调用PLOT过程。下面是在PROCPLOT语句中指定的选项。

DATA=指定使用的数据集

VPCT=规定图形的垂直高度占SAS输出页的百分比。

(2)PLOT——指定待绘制图形的垂直变量和水平变量,在该例中,使用了两个PLOT语句分别绘制散点图。

输出解释:输出1.2中的两张散点图表明指数值和红利值都有随时间增长而整体增长的趋势。一般说来,绘制散点图可以发现趋势及季节变化规律,这对于以后的分析是很重要的。

输出1.2打印指数和股息值对时间(以年为单位)的图形

3.2.3、计算单期收益

可以在DATA步中计算单期收益。SET语句从指定的数据集中读入观测。在下例中,观测从SP1中读入。赋值语句使用前面创建的变量和DATA步函数创建新的变量。在该例中,有3个新变量被创建:V_1,R和R_PER。V_1是V的滞后值;R是收益,R_PER是R的百分比形式。输入数据用于中间计算的变量,收益在输出1.3中打印输出。

输出1.3原始数据和单期收益(上面代码中v_1=lag(v),假设v为,那么v_1为)

输出解释:在输出1.3中,输入数据值及每年的收益值被打印。注意缺失值用“.”表示。由于年的滞后指数缺失,因而相应的收益值和百分比收益值缺失。

注意到(S&P)综合指数的年收益值变化范围为-0.(在年)~0.(在年)。因而持有股票(或股票的有价证券)就会产生诸如这样的问题:“多个周期的平均收益是多少?”,“复利计算如何影响多期收益?”。本章后面的“多期收益的度量”将会回答此类问题。

3.2.4、绘制收益图形

计算收益后,可以利用PLOT过程绘制收益对时间散点图来发现其随时间增长的发展趋势。下面的PROCPLOT语句完成此项任务。选项VREF=要求在竖轴上的某个指定值处画一条垂直于此轴的参照线,该例中其值为0。输出结果见输出1.4。

输出1.4收益对时间(以年为单位)的散点图

输出解释:在输出1.4中,散点图表明正的收益比负的收益多,但并没有明显的时间趋势。该图还表明70年代的数据分散程度要比80年代的大,需要进一步的分析来验证这一通过观察得到的结论。

3.3、多期收益的度量

多期收益的度量包括计算多个单期收益的算术均值和几何均值。因此,在评估多期的股票收益时,我们感兴趣的几个量如下:

算术平均值(AM)是几个时间周期的收益总和除以单个收益个数(T)。算术平均值度量各个周期的平均收益。

财富指数(WEALTH)表示投资产生(或损失)的财富。例如,你在年初投资1美元的股票股份,则财富指数(经过12个月或52周)就代表年终的资本值。如果财富指数大于1,则表示有价证券值增加。若小于1,则证券值减少。T个时期财富指数计算如下:

注意财富指数也等于投入资本的终值(WT)与初值(W0)的比值:

几何均值反映了多个时期的复合的、累积的收益,T个时期的几何均值定义如下:

你可以利用几何均值来计算多个时期的平均盈利。T个周期的平均复合收益(GM)计算如下:

3.3.1、计算多期收益指标

你可以计算数据集SP2的多期收益。例如,假设你想计算从5年到9年的财富指数、算术均值、几何均值以及均值的百分比值。为完成此任务:

(1)使用DATA步来创建一个子数据集;

(2)为便于计算,用TRANSPOSE过程对数据进行转置;

(3)用DATA步完成计算;

3.3.1.1、建立数据集的子集

下面的语句创建了一个包含5年到9年数据的子数据集:

句法说明:

①DATA——DATA步的开始并创建一个新的数据集SP3。

②SET——从指定数据集中读入观测,在该例中从SP2中读入。

③WHERE——规定观测被处理之前必需满足的条件。由于只有符合条件的观测被读入,因而使用WHERE语句可提高效率。本例中,条件为变量YEAR的值大于或等于5。

3.3.1.2、求数据集的转置

利用PROCTRANSPOSE可对数据集进行行列转置。转置后,观测变为变量,变量成为观测。下面的语句对SP3进行转置

句法说明:

①PROCTRANSPOSE—调用TRANSPOSE过程

DATA=指定被转置的数据集

OUT=创建并命名输出数据集

②VAR——指定被转置的变量。

如果要保留所有的转置,代码如下(这种情况才是主要的转置方法):

以下用PROCPRINT语句打印SP4。输出结果见输出1.5。

输出1.5打印SP4数据集

输出解释:在输出1.5中,数据集SP4的值被输出PROCTRANSPOSE对转置后数据集的列(即变量)加标签为:COL1至COL5。在该例中,标签为COL1至COL5的变量代表5年至9年的指数值。

3.3.1.3、计算收益大小

可以用DATA步和SP4计算下面的多期收益大小:

财富指数(WEALTH);

算术均值(AM);

百分比形式的算术均值(AM_PCT);

平均复合盈利率(GM);

百分比形式的平均复合盈利率(GM_PCT)。

下面的DATA步语句完成上述计算。变量C1至C5被创建是为了便于计算财富指数和平均复合盈利率。

如果变量太多,则数组处理是一种有效的编码方式。下面DATA步在迭代DO循环里使用数组来完成此功能。变量从C1至C5是由变量COL1至COL5生成的。

句法说明:

①ARRAY——创建一个临时的变量数组。数组可以有效地同样处理数组中的多个变量,一个简单的ARRAY语句具有下列格式:

ARRAYcurrug-name{number-of-elemces}list-of-variables;

在本例中,创建了两个数组(COL和C),分别含有5个变量。

②DO…END——在DO循环语句中,它以DO语句开始以END语句结束,中间嵌有其他SAS语句,其语法如下:

DOindex-variable=1TOnumber-of-variables-in-array;

其他SAS语句;

END;

关于DO循环中ARRAY处理的更多信息,请参考《SAS系统·BaseSAS软件使用手册》。

下面的PROCPRINT语句打印出了计算得到的各个收益指标值。

输出1.6多期收益指标

输出解释:在输出1.6中,收益指标值被输出。财富指数值(WEALTH)为2.表示在5年投入综合股票指数1美元到9年就增长到$2.51。因此假设你在5年投入了$0,则在9年将会变为$64.50

算术平均值(AM)和平均复合盈利率(GM)的值都超过0.20。这些值表明投入S&P指数的资本的年平均增长率超过了20%。

3.4、计算期望收益

股票分析家计算过去的股票收益,评价该股票的历史表现为衡量未来收益提供了一个基准。但是考虑到投资的目的,股票分析家还需要计算估计未来收益。

表1.1计算期望收益的方法

本部分讨论了前3种方法,而第4中方法在第四章中介绍。最后一种方法超出了本书的范围。

3.4.1、计算平均收益值

使用MEANS过程计算均值和其他概括性统计量。下面的语句计算SP3数据集中变量R和R_PER的均值。结果见输出1.7。

句法说明:

①PROCMEANS——用MEANS过程。下面是在PROCMEANS语句中规定的选项:

DATA=指定分析中使用的数据集

MEAN=列出要求计算均值的变量。

②VAR——说明分析中使用的变量

输出1.7用水平或百分比形式表示的算术平均收益

输出解释:输出1.7给出了平均收益值,它们和输出1.6中变量AM和AM_PCT计算出的值相同。但在输出1.6中,同时计算了其它值(GM,GM_PLT和WEALTH)。对于较大的数据集,以及计算概括性统计量,PROCMEANS比较有效。

3.4.2、计算离散分布的平均值

可能你的研究表明股票收益服从一种离散分布。即期望股票是按指定概率得到不同的收益值(概率值是非负的,其和为1)。例如,若有一种股票收益有20%的可能性为0.02,40%的可能性为0.,40%的可能性为.01,则该离散分布的均值为:

平均收益=(0.02×0.2)+(0.×0.4)+(0.01×0.4)

平均收益=0.+0.+0.=0.或1.4%

计算一种股票的期望收益价值不大;你的分析中可能包括上百上千种股票。下表列出多种股票的收益值及相应的概率。

表1.2股票收益的离散分布和指定的概率

每种股票收益都有自己的离散分布,每种股票的期望收益是其离散分布的均值。即收益(Ri,j)和相应的概率(Pi,j)的线性组合。因此,对第i种股票期望收益的离散分布的平均收益为i

为了计算离散分布的均值,使用DATA步和MEANS过程。以下DATA步创建数据集D1,并使用数组处理来计算收益(R)和概率(P1~P4)的线性组合。结果没有被表示。

下面的PROCMEANS语句计算平均值。结果见输出1.8。

句法说明:

①PROCMEANS——调用MEANS过程,下面是在PROCMEANS语句中规定的选项:

SUM计算列出变量的观测值之和

NOPRINT取消打印输出

②OUTPUT——创建输出数据集OUT_D1,这是在选项OUT=中命名的。OUT_D1中包含有平均值变量MEAN1-MEAN4。

输出1.8散分布的平均收益

3.4.3、使用增长率计算期望收益

可能你的研究表明股票收益有一个稳定的增长率,并且将继续保持下去。这个增长率可用来计算将来收益值。例如,用该序列最后的收益值乘以增长率加1的和,就可以得到该序列下一个阶段的收益值。

下面是几种合适的增长率:

以水平形式的算术均值(AM);

以水平形式收益的平均复合增长率(GM);

时间的线性或高阶多项式函数;

时间的非线性函数:例如,Logistic曲线。

前两种增长率在产生输出1.6中的语句中计算;第3种方法在第二章中介绍,而第4种方法已经超出了本书的范围。

该例子使用前2种方法,数据集为SP5。注意,SP5中的收益如输出1.4中的散点图所示,并假设按固定增长率增长。

使用下面的DATA步计算增长率值以及下一年的收益,注意变量COL5是该序列中最后周期(即9年)的收益值。未来收益值用PROCPRINT输出(见输出1.9)。

sp5数据集如下:

sp6数据集如下:

输出1.9从稳定增长率计算9年的收益(COL5)和0年收益

输出解释:在输出1.9中,输出了9年(标签为COL5)和0年(标签为R_AM的R_GM)收益值。用任何一种增长率(算术均值或年复合增长率),未来收益是—0年中最大收益,如同前面输出1.3中所示。

该方法适用于固定增长率收益序列,以及计算下一个阶段的收益不能适用于按不同的增长率增长的收益序列,或者计算很久的将来的期望收益。例如,如果该方法用来计算0年的收益值,则期望收益值将大大超过个百分点。

3.5、风险的度量

仅仅知道了某种股票的过去收益和期望收益是远远不够的,股票分析家意识到投资会伴随着风险,投资者应该在投资决策时考虑到期望收益和风险两个因素。

投资文献中把风险划分为几类,包括:

系统或市场风险,该风险与市场证券的变化有关。系统风险也称之为非多样化风险,这是因为拥有其它资产也不能减少该风险。也就是它不可能立刻变化。

非系统或非市场风险,该风险与除市场变化以外的因素相关(例如,影响股票收益的工业或公司因素)。非系统风险也称之可多样化风险,这是因为拥有其它资产可减少该风险。

其它风险种类:

——利率风险:是指利率的变化影响着未来收益的现值,如果利率增加(减少)则未来收益的现值会降低(增加),利率波动影响着一个公司的金融决策。

——膨胀率风险:是指影响货币购买力的膨胀率波动。膨胀率波动越大或越难以预测,其对投资者的决策影响就越大。

——货币风险:是影响国家投资决策的相对货币值(汇率)的波动。货币的升值和贬值都大大影响投资者的收益。

3.5.1、根据历史数据计算风险

对于股票分析家来说,风险通常用股票收益的标准偏差来衡量。标准偏差是方差的平方根,样本方差定义如下:

可以用MEANS过程计算SP3的标准方差,下面这组PROCMEANS语句用选项MEAN、VAR和STD来计算均值、方差和标准差。输出结果见输出1.10。

输出1.10均值、方差和标准差

3.5.2、根据离散分布计算风险

期望风险的度量可由列出的期望收益(Ri,j)和相应的概率(P)及计算该分布的标准差得到。例如,可用下面公式计算数据集D1中列出的股票收益的风险(标准差):

可以用DATA步和MEANS过程按下面步骤来完成此任务。在该例中,使用的数据为D1中4种股票的收益和概率以及OUT_D1中的分布均值。

上程序完成的工作:

(1)利用DATA步产生OUT_D1数据的新观测值,它们的值为均值。该例中,D1中有7个观测值,因此,在OUT_D1中也需要7个观测值。

(2)用DATA步合并D1和OUT_D2,在DO循环中使用数组产生中间变量VV1-VV4;

(3)为了计算标准差,使用PROCMEANS对中间变量求和,并把结果存入输出集OUT_D3

(4)在DATA步中使用数组计算方差的平方根,即标准差;

(5)使用PROCPRINT打印方差和标准差。

输出1.11离散分布的方差

输出1.12离散分布的标准差

输出解释:在输出1.11和1.12中,数据集D1中离散分布的方差和标准差被输出。你可以利用期望收益和风险水平来分析投资决策、比较股票、创建有价证券。这将在以后的章节中论述。

·4·

04医药股的聚类分析

现在我们用医药股45家公司年6月12日至年6月23日股价日收益率数据进行聚类分析。原数据格式如下:

4.1、导入数据

考虑到数据量限制为*,先导入数据再对数据进行转置操作。现将数据导入SAS中,其中包括数据转置代码。

生成的dcf10数据集部分如下:

4.2、初步分析

4.2.1、产生相关阵

下面的PROCCORR计算45种股价收益率的相关系数,共有5(45*45)个相关系数被计算。

结果部分展示如下:

4.2.2、产生距离矩阵

其中生成的dcf10b和dist1数据集部分如下所示。

4.3、聚类分析

4.3.1、最短距离聚类分析

下面使用最短距离法进行聚类分析。

结果:

CL44:泰格医药药明康德

CL40:1爱尔眼科通策医疗

CL35:康泰生物智飞生物

CL27:新和成浙江医药

CL25:天宇股份华海药业

CL23:华大基因迈克生物

CL17:8大博医疗凯利泰

第一类:

CL41+CL40=(CL42+COL10)+29爱尔眼科+41通策医疗

=(CL43+COL40)+10迈瑞医药+29爱尔眼科+41通策医疗

=(CL44+COL30)+40康龙化成+10迈瑞医药+29爱尔眼科+41通策医疗

=9泰格医药+35药明康德+30凯莱英+40康龙化成+10迈瑞医药+29爱尔眼科+41通策医疗

第二类:

CL35+CL22=8康泰生物+16智飞生物+(CL24+COL11)

=8康泰生物+16智飞生物+(CL26+COL32)+11万孚生物

=8康泰生物+16智飞生物+(CL28+COL14)+32贝达药业+11万孚生物

=8康泰生物+16智飞生物+(CL29+COL42)+14我武生物+32贝达药业+11万孚生物

=8康泰生物+16智飞生物+(CL30+COL19)+42博腾股份+14我武生物+32贝达药业+11万孚生物

=8康泰生物+16智飞生物+(CL31+COL43)+19长春高新+42博腾股份+14我武生物+32贝达药业+11万孚生物

=8康泰生物+16智飞生物+(CL32+COL45)+43艾德生物+19长春高新+42博腾股份+14我武生物+32贝达药业+11万孚生物

=8康泰生物+16智飞生物+(CL33+COL15)+45九洲药业+43艾德生物+19长春高新+42博腾股份+14我武生物+32贝达药业+11万孚生物

=8康泰生物+16智飞生物+(CL34+COL26)+15恒瑞医药+45九洲药业+43艾德生物+19长春高新+42博腾股份+14我武生物+32贝达药业+11万孚生物

=8康泰生物+16智飞生物+(CL36+COL31)+26健帆生物+15恒瑞医药+45九洲药业+43艾德生物+19长春高新+42博腾股份+14我武生物+32贝达药业+11万孚生物

=8康泰生物+16智飞生物+(CL37+COL28)+31金域科学+26健帆生物+15恒瑞医药+45九洲药业+43艾德生物+19长春高新+42博腾股份+14我武生物+32贝达药业+11万孚生物

=8康泰生物+16智飞生物+(CL38+COL36)+28药石科技+31金域科学+26健帆生物+15恒瑞医药+45九洲药业+43艾德生物+19长春高新+42博腾股份+14我武生物+32贝达药业+11万孚生物

=8康泰生物+16智飞生物+(CL39+COL20)+36欧普康视+28药石科技+31金域科学+26健帆生物+15恒瑞医药+45九洲药业+43艾德生物+19长春高新+42博腾股份+14我武生物+32贝达药业+11万孚生物

=8康泰生物+16智飞生物+(CL40+CL41)+20昭衍新药+36欧普康视+28药石科技+31金域科学+26健帆生物+15恒瑞医药+45九洲药业+43艾德生物+19长春高新+42博腾股份+14我武生物+32贝达药业+11万孚生物

=8康泰生物+16智飞生物+9泰格医药+35药明康德+30凯莱英+40康龙化成+10迈瑞医药+29爱尔眼科+41通策医疗+20昭衍新药+36欧普康视+28药石科技+31金域科学+26健帆生物+15恒瑞医药+45九洲药业+43艾德生物+19长春高新+42博腾股份+14我武生物+32贝达药业+11万孚生物

第三类:

CL16+CL19=(COL1+CL18)+(CL25+COL37)

=1老百姓+(CL20+COL24)+4天宇股份+13华海药业+37XD司太立

=1老百姓+(CL35+CL22)+24普洛药业+4天宇股份+13华海药业+37XD司太立

=1老百姓+8康泰生物+16智飞生物+9泰格医药+35药明康德+30凯莱英+40康龙化成+10迈瑞医药+29爱尔眼科+41通策医疗+20昭衍新药+36欧普康视+28药石科技+31金域科学+26健帆生物+15恒瑞医药+45九洲药业+43艾德生物+19长春高新+42博腾股份+14我武生物+32贝达药业+11万孚生物+24普洛药业+4天宇股份+13华海药业+37XD司太立

第四类:

CL15+CL21=(CL16+CL19)+(COL22+CL23)

=1老百姓+8康泰生物+16智飞生物+9泰格医药+35药明康德+30凯莱英+40康龙化成+10迈瑞医药+29爱尔眼科+41通策医疗+20昭衍新药+36欧普康视+28药石科技+31金域科学+26健帆生物+15恒瑞医药+45九洲药业+43艾德生物+19长春高新+42博腾股份+14我武生物+32贝达药业+11万孚生物+24普洛药业+4天宇股份+13华海药业+37XD司太立+22英科医疗+33华大基因+34迈克生物

4.3.2、打印指定数目的类

下面指定限定OUT=数据集中类的个数为5。

输出解释:COL27(兴齐眼药)、COL17(国际医学)、COL7(普利制药)和COL6(特宝生物)各自成一个类,其余公司合并为一类。

4.4、计算风险

下面我们针对医药股45家公司年6月12日至年6月23日股价日收益率数据进行风险分析。

结果解释:医药股45家公司年6月12日至年6月23日股价日收益率的均值范围为-0.895-0.7357;方差范围为4.7643-25.6871;标准差范围为2.-5.0。

下面我们针对医药股45家公司年6月12日至年6月23日股价日收益率数据计算相应的夏普比率。

结果解释:对夏普比率进行升序排序后,夏普比率最高的三家公司分别为COL17(国际医学)、COL42(博腾股份)和COL41(通策医疗)。

往期推荐

·感情贴(15):老师的告诫、以及生活幸福感分享

·感情贴(14):材与不材之间、上证50看涨期权与股票排序聚类SAS代码——第篇

·感情贴(13):寻找便宜公司的艺术、沃尔特.施洛斯回忆录——证券研究长篇连载第篇

作者简介

青岛人,2年小学一年级接触股票,少年时做过播音主持,中学时理想是成为优秀基金经理。此后留美多年,毕业于密苏里州立大学金融工程系与会计系和乔治华盛顿大学金融系,在高校里学习十年整,留学期间曾获全额奖学金(GRE,满分),美国注册会计师,回国后供职于券商、目前担任券商自营某部门负责人,获得过两届新财富策略分析师。现在写这个连载,一方面为工作交流,另一方面作者希望在生活与感情能够端正踏实、坚持勇敢。

预览时标签不可点收录于话题#个上一篇下一篇



转载请注明地址:http://www.rengaozhengabb.com/rhhc/9572.html
  • 上一篇文章:
  • 下一篇文章:
  • 热点文章

    • 没有热点文章

    推荐文章

    • 没有推荐文章