时间:2022-05-11 11:29:12
序论:写作是一种深度的自我表达。它要求我们深入探索自己的思想和情感,挖掘那些隐藏在内心深处的真相,好投稿为您带来了一篇多元统计分析论文范文,愿它们成为您写作过程中的灵感催化剂,助力您的创作。
摘 要:面对新常态下的新环境、新机遇、新挑战和新要求,我们要充分认识到发展才是硬道理。只有坚持不懈地推动发展,才能避免落入中等收入陷阱,才能保证中华民族自立于世界民族之林的地位。通过聚类、判别、主成分、因子等统计分析方法,对全国31个省市经济实力进行综合评价,并对各地如何利用自身比较优势形成持续改革和创新这一新动力进行了客观分析、可以供部门领导决策和参考。
关键词:31个省市;经济发展;多元统计;分析
风正帆悬逐浪疾,勇立潮头越雄关。在金融危机、货币博弈、外需疲软、“三期叠加”等错综复杂的国内外环境下,中国经济呈波浪式螺旋前进,进入了形态更高级、分工更复杂、结构更合理的新常态,进入了“爬坡越坎”的关键阶段。多次强调,大时代需大格局,大格局需大智慧。在中国经济步入新常态下,大力推进“一带一路”建设,抢抓“重要战略机遇期”成为支撑中国经济发展、塑造对外开放新格局的重中之重。如何在新常态中抢机遇、赢发展呢?我们要用开放倒逼改革,以改革深化开放,用改革开放赢得发展。
本文以2014年中国统计年鉴为数据基础,通过聚类、判别、主成分、因子等统计方法对全国31个省市经济实力进行多元分析,以求在新常态下对各地经济发展水平进行科学评价,找出影响经济发展的关键因素,为各地抢抓机遇,实现“一带一路”国家战略提供决策参考。
一、聚类分析
当今世界已经进入了全球一体化的时代,城市作为国家的经济、政治、科技和教育文化发展中心已经成为经济循环的主角。而决定每个城市的地位、作用以及未来发展事态的主要因素是它们各自拥有的综合经济实力。
“物以类聚、人以群分”,对事物进行分类,是人们认识事物的出发点,也是人们认识世界的一种重要方法。因此,我们就采用聚类分析方法,将31个省市进行科学分组。聚类分析采用定量统计方法,找出一些能够度量变量亲疏关系的统计量,以此为依据,把一些相似程度较大的变量聚合为一类,关系疏远的聚合为另一类,从而发现规律,认识客观现象。
(一)变量的选取
为对全国31个省市综合经济实力进行科学评价,我们首先采取聚类分析方法把其进行有效分类,确定哪些城市的经济发展处于同一集群,具有高度同质性,哪些城市的经济综合实力相对较弱。本文选取了12项通用的社会经济指标,具体为人口总数、GDP、第一产业产值、第二产业产值、第三产业产值、资本形成总额、财政收入、财政支出、货物进出口总额、居民消费价格指数、商品零售价格指数、人均消费水平。
(二)距离统计量、聚类方法及标准化
1.距离统计量。为将变量进行科学分类,我们需要研究它们之间的关系,需用一个统计量来刻画其之间的距离。本文采用最为常用的平方欧氏距离(Euclidean distance)。
二、判别分析
为对聚类分析结果进行科学评判,我们根据判别分析的基本原理,采用贝叶斯判别准则对聚类情况进行判别。贝叶斯后验概率公式如下:
从表3看,使用聚类分析的统计方法对全国31个省市经济综合实力进行分组的结果,与贝叶斯判别预测的分组结果完全吻合,且从后验概率的检验结果分析,各组分类的样品属于该类的概率均呈显著性,通过判别分析,聚类分析进行的分组效果良好。
三、主成分分析
为能从大量的原始指标中综合出较少的几个综合指标,以找出影响各省市经济发展的主要成分,我们采取了主成分分析法。其优点在于通过采用降维的方法,用少数几个综合指标来反映大量原始指标的主要信息,使得我们分析各省市综合经济发展影响因素得以简化、直观。
(一)计算主成分
(二)提取主成分
通过对全国31个省市的主要经济数据进行主成分分析(详见表4),前两个累计贡献率已达85.92%,满足提取主成
分的累计贡献率不小于85%的原则,可以提取两个主成分。根据因子载荷矩阵和主成分系数向量矩阵的如下关系:
从第一主成分函数看,GDP、第二产业产值、第三产业产值、财政收入、财政支出、资本形成总额其系数接近且在式中影响较大;从第二主成分函数看,第一产业产值、商品零售价格指数系数较大。从拉动地方经济角度看,要加快经济的转型升级,从以上两个关键之处入手,效果较为明显。其中就包括了GDP结构合理调整、发展速度的“换档提速”、以财政资金引导社会资本进入竞争性领域、扩大社会商品零售总额等。
四、因子分析
为能在主成分分析的基础上对全国31个省市的经济发展实力进行综合比较,找出各经济变量相互依存的“无形的手”,我们选择因子分析中的因子得分对各地经济实力进行综合排名。
五、我国经济现状及形成新动力的途径
(一)我国经济发展现状
在“三期”叠加和四大镇痛(制造业去产能化、环境去污染化、房地产去泡沫化、环境去污染化)的背景下,我国经济下行压力不断增大,增速放缓。今年以来,在错综复杂的国内外环境下,中央坚持稳中求进的工作总基调,创新宏观调控方式,以全面深化改革促发展、调结构、惠民生,使经济稳步走向“新常态”。所谓“新”,即经济增长由高速转向中高速,发展方式由规模速度型粗放增长转向质量效率型集约增长,发展结构从增量扩能转向调整存量做优增量的深度调整,发展动力从传统增长点转向新的增长点。我们的经济发展也取得了来之不易的成绩。以2015年一季度为例,虽然增速有所回落,但这是一个让人“不难受”的速度,用老百姓的话讲就是既有“面子”又有“里子”。从主要经济指标看,一季度GDP增长7%,合乎预期,在全球范围是很快的,而且在基数较大的情况下,我们的增量也较大;城镇新增就业324万人,就业形势平稳;城乡居民收入水平同比增长8.1%,各项民生指标继续明显改善。一系列重大改革举措相继出台,一些新增长点破茧而出。经济金融风险总体可控,社会大局稳定。
尤其要看到,在增速放缓的同时,经济发展质量得到进一步提高,结构调整稳步推进,转型升级势头良好,出现了新的积极变化。产业结构方面,服务业跑出了“加速度”,经济结构由工业主导向服务业主导转型的趋势更明显。需求结构方面,投资增速虽有放缓,但消费增长比较稳健。收入分配结构也在持续改善,农民收入增速继续快于城里人,城乡居民的收入倍差在缩小。一季度单位GDP能耗同比降了5.6%。一些新主体、新产业、新业态、新产品、新动力在加快孕育。
(二)形成经济发展新动力的途径
中国幅员辽阔,各地区差异较大。主要体现在:一是从自然资源方面看,西部地区能源、原材料等资源最丰富,中部地区次之,东部地区相对贫乏;二是从经济发展水平看,东部最为先进,中部与西部阶梯状向下发展;三是从人口文化素质、市场经济意识、交通基础设施、改革开放程度的影响看,东部地区的市场体系发育程度比中西部地区市场体系更加坚强。在新常态中,各省市如何抢抓发展机遇,在充分发挥比较优势下融入“一带一路”的国家战略,赢得地区发展,其根本途径在于持续改革和创新。一是要着力推动科技创新。在新的技术领域,如增材制造、数字机器人、分布式能源、智能电网、物联网、新材料等领域,我国与发达国家大体上站在同一起跑线上,我们有机会走在创新的前列甚至最前沿。我们应统筹配置创新资源,以在这些新技术领域实现创新的重大突破。二是要着力推动生产组织方式创新。对我们而言需要把握两个方向:应用新技术革命成果,优化大规模集中式生产组织流程;适应市场需求多元化的趋势,发展小型化、个性化生产。三是要着力推动商业模式创新。要创造一个宽松的、有利于创新的环境,但也要引导和规范商业模式的创新,坚决杜绝以商业模式创新之名扰乱市场竞争秩序,切实保证商业模式创新走在健康的轨道上。四是要统筹利用国内外创新资源。我们要以开阔的胸怀,虚心学习其他国家的创新经营经验,广泛借鉴其他国家的创新成果,更大程度、更大范围扩大合作创新的内涵和形式,充分利用全球的创新资源。五是要加快构建良好的创新生态环境。要“充分发挥市场中资源配置中的决定性作用和更好地发挥政府的作用”,要加快推进各领域特别是科技创新领域的改革,建立健全创新所需的体制机制,激发全社会的创新活力和潜力,让创新成为生产力发展的第一推动力。
摘要:国民区域经济的发展很大程度取决于国民经济指标的衡量因素,其中很大部分在于对区域经济分析及评价,当前对于国民区域经济评价的方法有多元统计分析、函数型数据分析、线性分析和决策论等。其中多元统计数据分析是一种使用较为普遍的经济分析理论工具,其主要是通过对历史数据进行比较分析和参数修正,推导出区域经济的发展状况。
关键词:多元统计分析;武汉城市圈;聚类分析;经济评价
一、多元统计分析方法及其主要类型
(一)主成分分析
主成分分析的方法论就是数学降维方法的运用,其宗旨在通过新变量代替旧变量,同时新变量之间是独立的,同时使用者还可以自己决定是否进行分布统计,因此,主成分分析就是一种以多数相关的变量取代少数不相关变量的分析模式。主成分分析的基本特征就在于其可以避免设定参数与实际误差的影响到最后的统计分析结果,并且在统计的过程中该分析方法选取了较多的变量,提高了变量基数大小的准确性,同时在分析的过程中变量较少,而且较少的变量之间互相不影响,这样的一个过程可以使得统计分析结果与实际情况更加符合。[1]
(二)因子分析
因子分析方法是在主成分分析基础上发展出的分析方法,其主要研究的对象就是矩阵内部的联系程度,即以带有原始指标数据的矩阵为基础,研究该矩阵的内部结构,进而寻找对该结构具有支配作用的独立新的因子,从而定位那些能够影响变量的特殊因子。因子分析的目的不在于寻找主因子,而是要知道这些因子所代表的含义是什么,可是主成分分析方法寻找到的主因子的解初始载荷矩阵并不满足简单结构原则, 各因子的典型代表变量不很突出,因而容易使因子的意义含糊不清,不便于以因子进行经济解释。为此可对因子进行旋转,以便得到满意效果。[2]
(三)聚类分析
聚类分析的基本定义是通过统计变量的分布情况,并在分析过程中将具有同类性质的变量予以归纳总结,从而实现减少系统变量的目的的一种统计学方法。[3]实际上,聚类分析法就是一个寻找一种统计量,即可以客观反映变量之间密切联系程度的统计量,在此基础上对这些变量进行分类,目前常用的聚类统计量有距离系数和相似系数两类。但是聚类分析方法主要有三种:系统聚类法、调优法、图论法。
二、多元数据统计分析方法的意义
多元数据统计分析方法是随着计算机的迅速发展而兴起的数理统计学的分支,借助计算机对数据超强的处理能力而研发的统计分析软件已经使得统计分析变得更加简单,并且可以处理更大容量的数据,可以说大数据时代已然来临,而多元数据统计分析方法也被应用到经济发展的各个领域。多元数据统计分析主要是对数理统计方法的原理应用,进而对多变量问题进行研究的理论和方法,其可以将复杂的基尼指标变得简单化,更加清晰地反映经济指标的背后含义,这也是多元统计分析的最重要的作用,多元统计分析方法可以在不有损既有信息的前提下,进行变化和构造模型,使得复杂数据简单化。
三、多元统计分析方法在国民区域经济评价的应用
(一)武汉城市圈区域经济发展指标的选取与分析
区域经济发展的状况是需要从整体上予以评估和考量的,而这种经济评价可以客观反映区域经济发的综合经济实力,展现与区域内的整体经济发展水平,综合经济实力就是区域内的具有的全部经济实力和发展潜力,以及经济地位和影响力。[4]
本文所选取的分析对象是武汉市的区域城市圈的经济发展指标,其中的数据来源主要是湖北统计年鉴和湖北省统计局于2014年所公布的数据,通过这些数据我们可以大致了解武汉城市圈区域经济的基本综合经济实力。所以,我们主要选取了其中的15项经济指标,并标记为X1-X15,同时利用了SAS统计分析软件进行了分析,最后的统计分析结果如下表。
(二)聚类分析及其结果评价
聚类分析主要是将需要分类的对象按照特定的规则和方法进行分类,我们主要是对这些数据的特征进行观察,然后确定这些分类的。在聚类之后,同一组内的对象应当具有相似性,而不同组的对象是不相同的。我们根据表3.1的原始数据,我们可以对武汉城市圈区域内的九个城市进行聚类,结果如图1和表2。
(三)结果评价
根据以上的聚类结果的分析,我们基本上把武汉城市圈区域内的九个城市分为三类,通过表图1和表2可以看出,不同类别区域的指标分值的差异,由此也体现了其城市综合经济实力的差距。
首先,区域内的经济实力最强的当属湖北省会城市武汉,因为武汉是该区域内的经济中心,基于其地理位置的优势,交通和基础设施完备,这些指标都是经济发展的重要影响因素,而且武汉作为该区域经济的中心,其领导地位是毋庸置疑的,武汉也需要充分利用自身的优势带动周边经济体的发展。
其次,该区域内的综合经济实力第二类就是黄冈、咸宁和孝感了,该三个城市的相同点都在于地理位置的便利性,而且经济发展模式比较健康,在利用外资方面成绩显著,在武汉城市圈内整体实力较为强大,因此该类城市需要发挥自身的优势,协同武汉共同实现区域经济整体实力的提升。
第三类就是表2中的结果,该类城市的经济综合实力一般,其中的代表性城市有黄石和鄂州,这些城市区域的经济发展比较快,可是相对于第一类和第二类的经济实力还是有所差异性,特别是黄石地区的经济基础设施相对完备,但是在发展速度上还略显落后,整体经济发展水平还有待提高。
摘 要:从贸易类别划分,以及贸易完善程度与全球经济贸易组织参与程度的关联等几个方面,采用多元统计分析方法,探讨我国贸易在全球经济体中的位置,以及全球贸易的总体特点。
关键词:国际贸易;多元统计分析方法;比较
研究对象:中国以及2005年与中国贸易往来量高的国家,所有这些国家的贸易总额占全球总额的60%。
(一)基本方法
聚类指标:人均GDP,人均贸易总量,每万平方公里总产值,每万平方公里贸易总量,贸易总额与GDP比值,人均国土面积。上述变量有一定的重复成分,因此要对数据降维。采用因子分析的方法,筛选因子的规则是特征根大于1。
(二)2005年和2000年贸易类别划分
2005年:按照特征根大于1的规则,选取了两个因子,能解释原有变量的85.46%的信息,解释效果比较好。
16个国家的因子得分(见表1)。
再用这两个因子将16个国家聚类。聚类结果分成三类:
第一类:印尼,中国,印度,马来西亚,泰国,俄罗斯,韩国;第二类:澳大利亚,加拿大,法国,日本,英国,德国,意大利,美国;第三类:新加坡。
2000年:用同样的方法,利用2000年的数据将16个国家聚类,分类结果与2005年完全相同,这表明了上述分类的稳定性。
(三)聚类说明
根据各项指标的汇总数据来看,第一类属于贸易发展有待完善的国家,第二类属于贸易发展比较完善的国家,它的所有指标都要高于前者(除贸易总额与GDP比值之外),第三类是贸易发展相当完善的国家,它只有一个国家―新加坡。
二、贸易完善程度与全球经济组织参与程度的关联研究
(一)问题的提出
从以上分类的结果来看,不考虑新加坡,其他两类有一定的规律性,第一类以亚洲国家居多,而第二类以欧美国家居多。在全球以及区域贸易经济组织中,欧美国家的活跃程度要高于亚洲国家,那么这是否表明:一个国家参加的贸易经济组织越多,贸易就越发达呢?为了验证这个设想,首先列出全球几个主要的贸易经济组织以及研究的15个国家的参与情况。
全球性的世界贸易组织(14个):澳大利亚,加拿大,法国,英国,意大利,日本,德国,马来西亚,泰国,印尼,韩国,美国,印度,中国。
世界四大区域性多边经济组织(北美自由贸易区,欧盟,亚太经合组织,东盟)。北美自由贸易区(两个):美国,加拿大;欧盟(4个):法国,英国,意大利,德国;亚太经合组织(10个):中国,澳大利亚,加拿大,马来西亚,日本,泰国,印尼,俄罗斯,美国,韩国;东盟(3个):马来西亚,泰国,印尼。
(二)数据整理
利用如上的参与情况,可以将研究的15个国家进行划分(见表4)。
再将这里得到的分值与前面分析得到的类别进行交叉,结果(见表5)。
(三)利用对应分析验证设想
设想:参加成熟的贸易组织越多,贸易越发达。若用上面的表格来解释,也就是一个国家的贸易分值越高,其趋向于归入第一类的程度越高,这也就证实了贸易组织对贸易的促进作用。
对应分析结果:由于行列最小值为2,故最大维度是2-1=1,该维度解释了全部的信息。下面两张表分别是行和列在这个维度上的得分(见表6)。
从表6可知,行的第一类得分接近于列的“分值≤4.5”,而行的第二类得分接近于列的“分值≥5”,同时行和列的不同类别分值差距较大(说明行和列的划分是有效的),因此验证了设想。
摘要:多元统计分析是从经典统计学中发展起来的一个分支,是一种综合分析方法,能够在多个对象和多个指标的相互关联中分析它们的统计规律,多元统计的发展越来越完善,已经被广泛地使用在各个领域当中。在我国市场激烈竞争的经济发展背景下,许多企业面临着许多的经营风险,其中企业财务危机是导致企业破产的一个重大因素,许多企业出现内部控制不当、风险意识薄弱、投资决策失误等对企业不利的行为,使企业出现财务状况恶化,出现企业财务危机,而多元统计分析在企业财务危机预警中充当着十分重要的角色。因此,下文对多元统计分析在企业财务危机预警中的作用做出了探讨。
关键词:财务危机原因 多元统计 分析危机 预警作用
国内学者对于公司财务危机预警的研究也越来越多,然而学者们大多数只针对纯财务指标构建财务危机预警模型,却忽略了非财务信息的作用。很显然,单一的财务数据所能体现的信息还不够完整,很难反映公司的真实情况,难免会造成预警的偏差,而非财务信息能够对财务信息进行有效地补充,因此,引入非财务指标构建预警模型是非常有必要的。
一、企业财务危机产生的原因
许多现代企业面临着危及生存的问题,财务危机是企业的一大重要问题,许多企业管理不得当,财务环节控制不到位,并且缺少有效的监管机制,造成企业财务管理混乱。企业财务危机是法律意义上对企业破产的定义,企业破产是用来衡量企业财务危机最常用的标准。企业财务危机有负债危机、市场危机、收益质量危机,除此之外,长短期资产配置不当、企业财务机制不健全、管理层的财务管理素质低下、企业本身的风险意识薄弱等都会造成企业财务危机的发生,由于企业更倾向于通过负债来获取收益,因而当风险意识不强时极易形成高度负债,在企业出现入不敷出的财务危机时便会导致破产。
二、多元统计分析
(一)多元统计分析概述与作用
多元统计分析是一种综合分析方法,能够在多个对象和多个指标互相关联的情况下分析它们的统计规律。多元统计规律包含很多内容,主要包括多元正态分布及其抽样分布、多元正态总体的均值向量和协方差阵的假设检验、主成分分析和因子分析、判别分析和聚类分析、直线回归与相关、多元线性回归与相关。多元统计分析可以对许多数据进行观测以及预测,多元统计分析即为分析多元数据的统计方法。根据统计规律性对未来企业财务情况做出预测,根据多元的数据对财务情况进行多方面的设想与观测,预测企业未来发展过程中可能会发生的财务危机情况以及危机程度,让企业提早知晓可能发生的财务危机,并做好全方面的应对措施。
(二)多元统计分析在企业财务危机预警中的主要方法
多元统计分析主要是使用判别分析和主成分分析建立企业财务危机预警模型。首先,在建模的过程中利用随机抽样和对应样本法在企业中进行选择,选取各类指标来反映企业的财务情况,变量越多企业财务危机预警模型就建立的越好。其次,利用抽样选取法抽选出样本和变量,依据这些样本和变量使用判别分析法建立企业财务危机的预警机制。第三,将企业中抽取出来的多个变量通过线性交换选出较少的数量并且是重要的变量,由于变量之间都存在着一定的相关关系,而且要以最少的变量来建立模型,所以要将相关重复的变量除去,最后剩下各不相关的变量,全方面分析企业中存在的问题,这就是主成分分析。
三、多元统计分析在企业财务危机预警中的作用
(一)对财务危机进行分析和预测
多元统计可以通过抽取变量建立预测模型对企业未来的财务危机进行分析和预测,从各个不同的角度预测企业未来可能发生的财务危机,并且经过验证判断企业是财务危机公司,或是非财务危机公司,或是中间状态公司。这种方法的正确率十分高,但是如果预测的年份越远,预测的准确率就会越低;反之年份越近预测的精确度就越高。因此,企业需要及时更新企业的财务危机预测模型,根据不断变化的数据和指标对企业财务危机进行分析,提高预测的准确率,对未来所可能出现的危机做出适应的措施。
(二)减小财务危机对企业的影响
多元统计分析可以减小财务危机对企业的影响,可以通过多元统计分析对企业进行分类,依据采集到的数据建立的模型,辅助分类企业判断是否处于财务危机状态。如果预测结果为财务危机企业,必定会引起相关部门对企业发展的重视,以及采取各类的方法对企业未来可能会发生的财务危机进行合理地防范,企业会谨慎对待发展的每一个步骤,加强风险意识,减小负债率,减小财务危机对企业的影响。
(三)促进市场经济健康发展
以多元统计分析对各个企业进行财务危机预警,使我国的每个企业都能够划分清楚,并且采取最全面、有效的体系适应国内企业的发展,在一定程度上减少了财务危机带来的影响,促进了市场经济的健康发展,提高我国的经济发展水平。
四、结束语
多元统计分析是一项对研究企业财务危机十分有效的方法,在其他领域的应用也十分广泛,多元统计分析可以为企业带来完善的财务预警体系,使企业预测未来可能会发生的财务危机,对未来发生的财务危机采取适当的、避免发生的措施,促进了企业经济的健康发展。
摘 要:本文以风电设备上市企业为研究对象,建立符合该行业特点的财务预警指标体系,并采用多元统计分析的方法进行财务预警分析,以达到帮助风电设备上市企业对财务危机提前做出应对的目的。
关键词:风电设备上市企业;财务预警;多元统计分析
引言
在清洁能源尤其是风能的迅速发展过程中,风电设备制造行业起着至关重要的作用。由于我国的风电设备制造技术与发达国家仍然存在着不小的差距,若风电设备制造企业未能拥有安全的财务状况,将会阻碍我国风电产业的发展。因此,对风电设备上市企业财务预警问题进行研究是十分有必要的。 Fitzpatrick [1]首先建立了财务预警模型,单变量模型,其研究结果表明净利润与股东权益之比,股东股本与债务总额之比这两个指标对企业财务状况的判别能力较高。在我国,最早研究企业财务状况的是吴世农和黄世忠[2],当时的主要思想是经验分析以及规范性说明,局限性很大。本文将多元统计分析方法运用到财务预警问题中,并构建较为全面的指标体系,以达到良好的财务预警目的。
1.财务预警指标体系的构建
通过对相关企业财务状况研究的文献进行研究分析,总结归纳出了一般上市企业财务预警的主要指标[3],如表1所示。
除了以上五个方面的财务预警指标外,考虑到风电设备上市企业自身的特点,本文还引入如下4项符合风电设备行业特性的财务指标。
(1)成本比率(X21),其指的是管理费用与主营业务收入之间的比值,由于管理费用的界定比较模糊,所以在一定程度上可以衡量企业管理者的成本。
(2)托宾的Q比率(X22),其指的是企业市场价值与企业资产重置成本之间的比值,该指标将股票价格与投资支出相互联系起来,以反映货币供应,股票价格,投资支出与总产出之间的联动关系。
(3)应收账款比例(X23),其指的是应收账款额与利润总额之间的比值,由于应收账款有可能无法收回,所以会对企业的利润产生一定的负面影响。
(4)资本充足率(X24),其指的是企业资本总额与加权风险资产总额之间的比值,反映了在债权人或存款人的资产在受到损失之后,可以利用自身资本可以挽回损失的程度。
2.多元统计分析财务预警模型的构建
判别分析表示的是在已经研究对象分类情况的前提下,分析样本数据,归纳和推到出一系列判别函数,同时规定判定标准,从而是判别准确率最大。其数学描述如下:
假设由g个p维种类G1,G2,…,Gg,其分布函数分别为F1x,F2x,…,Fgx。对于指定的某一样本x=x1,x2,…,xp来说,需要判别该样本属于哪个种类。
对于样本种类的划分,这里运用主成分分析法就行解决,并依据主成分贡献率及累计贡献率计算出各个样本的综合评价值。计算公式如下:
F=∑nj=1dj×fj(1)
上式中,dj表示主成分贡献率,fj表示单个主成分得分。
fj=∑ni=1bij×xi (2)
上式中,bij表示主成分得分系数,xi表示经过标准化处理的评价指标值。
3.实例分析
本文选取我国41家风电设备上市企业2011年到2013年的财务指标数据作为研究样本进行验证分析[3]。
首先,运用主成分分析法对这41家风电设备上市企业的24个财务指标数据进行主成分提取,其结果见表2。
其中,Y1,Y2,Y3和Y4分别表示财务预警的差、中、良、优四种类别。
利用上述判别函数,对41家风电设备上市企业的财务状况进行判别,其中4家财务状况为差的企业全部判断正确;4家财务状况为优的企业全部判断正确;17家财务状况为中的企业,有15家判断正确;16家财务状况为良的企业,有15家判断正确。该模型的整体正确判别率达到了92.7%,说明该模型具有良好的判断效果。
4.结论
本文构建了符合风电设备行业特点的财务预警指标体系,将主成分分析法和多元统计分析法结合起来对41家风电设备上市企业的财务状况进行了判别,判断准确率超过90%,验证了该财务预警指标体系及其预警模型的有效性。(作者单位:中国地质大学长城学院)
摘 要 从培养学生实践能力、提高教学效率、激发学习兴趣和引导学生主动学习几个方面,阐述增强医用多元统计分析教学效果的几点体会。
关键词 医用多元统计分析;实践能力;统计软件
随着现代计算机技术和网络技术的发展,医疗卫生领域逐步完善生命健康相关信息登记的数据库,各类数据库之间相互链接形成医药卫生行业的海量信息。面对海量信息,如何透过数据的表面现象抓住其本质?如何通过众多的数据挖掘出有关生命健康的科学规律?迫于此形势的需求,各医学院校纷纷开设医用多元统计分析课程,培养医学研究工作者将各种多元统计分析方法应用到医药卫生领域数据中的能力。
医用多元统计和基本卫生统计构成医药卫生领域内处理数据的有力工具,两者都用到数理统计和概率论的知识,故在教学方法上医用多元统计有许多可以借鉴基本卫生统计的教学经验。医用多元统计分析处理多变量数据,相对于处理单变量数据基本卫生统计方法而言,医用多元统计又呈现出众多自己的特点,比如繁琐的矩阵、复杂的建模、庞大的运算、抽象的概念[1]等。因此,在借鉴基本卫生统计教学方法的同时,还必须依据本课程的特点认真考虑如何增强该课程教学效果的问题。笔者在几年的医用多元统计分析教学中有四点体会与大家分享。
1 通过教学环节培养实践能力
医用多元统计分析属于应用性的方法学科,课程性质要求学生在学习多元统计方法之后,要具备将各种多元统计分析方法应用到医疗卫生领域数据中的能力。培养学生的实践能力,仅从理论授课上下功夫提高学生实践能力是远远不够的,必须在理论授课、实验教学和课程考核等各个教学环节中都不脱离实践能力培养的主线。在理论课上讲授的内容一般包括原理方面的知识和如何分析实际数据两个方面。提高学生实践能力要求教学过程中淡化数学原理方面的知识,而将重点放置在如何分析实际数据上,即该多元统计分析方法使用的前提条件是什么,如何使用该方法以及分析结果如何解读,在具体研究的医学问题中此结果具有什么样的意义。
尽管在现代教学方法中有体验式教学的渗入[2],但相对于实验课的实际体验来讲,学生对于数据何时采用、如何采用某种多元统计分析方法,还是保持在似乎知道,但又不完全明确的模糊阶段。很多原理方面的知识,尽管不是重点,但也需要学生了解一下,才能有助于把握整体脉络、合理应用,通过实验课的亲身体验,能直观观察到相对模糊的原理知识得到验证的过程,从而心服口服地从心底接受没有经过手工计算而呈现的分析结果。并且多元统计分析的实验课本身就是让学生去体验各多元统计分析方法怎样应用于实际数据的过程,从而使学生实践能力大大提高。
一般课程考试比较侧重理论原理的考核,而医用多元统计分析授课的目的就是给学生讲授多元统计方法应用于医药卫生领域数据的实践过程,学习课程之后学生必须具备这种实践能力,否则就根本没有实现开设这门课程的初衷,没有达到教学目的。因此,课程考试也应侧重在学生实践能力的考核上。课程考核一般有试卷考核、平时实验成绩和上机考核三种形式,而以试卷考核的形式居多。对于医用多元统计分析课程,平时实验成绩考核和上机考核也应该是必须选择的考核形式,除此以外,在试卷考核中也可通过适当的题型体现对学生实践能力的考查。比如,将多元数据分析的结果展示在试卷上,让学生回答此分析结果对于研究目的反映出什么;或者指出研究目的,让学生回答选用何种多元统计分析方法,为何选用这种方法;或者从展现的结果让学生判断是否适用某种多元统计分析方法等多种题型来考查学生的实践能力。通过考核反馈出实践能力欠缺的部分,从而给予相应的应对措施。
2 通过教学软件提高教学效率
多元统计分析建模一般都要经过逆矩阵、相关系数矩阵的计算,求解特征根与特征向量等过程,这些过程没有扎实的数学功底是根本不可能完成的。即便能完成这些运算,但也是相当耗时的过程。就运算相对简单的多元统计分析方法而言,如果采用人工计算器计算的话,也需要大约五个学时的时间才能完成,复杂的多元统计方法需要学时数就更多了。假定学校能够安排充分的学时数,学生也必须有足够的能力和耐心去完成这些运算。可见,统计软件和多元统计分析方法教学的结合是非常必要的。
目前,常用的统计分析软件有SAS、SPSS和STATA。对于医学专业本科生和研究生的统计分析要求来讲,简单掌握每个软件基本功能就可以满足数据分析的需求,但对统计学专业的研究生而言,一般需要用到可编写程序的SAS软件,并且要深入学习,进行数据的模型拟合分析。各医学院校可根据自己的办学条件、师资力量、教材的情况、授课对象等因素综合考虑本院校采用医用多元统计分析的软件。借助软件在很短的时间能完成模型的建立、模型拟合检验等分析过程,通过分析结果中呈现的模型建立中间步骤,了解矩阵运算,求解特征根与特征向量的信息,把握前因后果、各步骤间的相互关系,大量时间的节余可用在多元统计分析方法的专业应用上。
3 通过适宜教材激发学习兴趣
多元统计分析原理部分的繁琐复杂性对该课程的学习形成很大阻碍,且原理部分又不是医学专业学生学习的重点,这提示了教材选择的重要性。合适的教材不应该花费很大的篇幅在理论推导和模型建立的过程上,否则只会增加学生对该课程的畏惧心理。教材应当侧重于多元统计方法的应用部分,应用部分和学生专业的相关性越强,就越容易激发学生学习兴趣。
上文中提到学习医用多元统计分析教学要结合统计分析软件,因此,教材中最好在每个多元统计方法的介绍之后都安排一个章节,说明这种多元统计方法通过统计分析软件如何实现,以及软件运行结果如何解读。医学各专业学生一般都未经过系统的统计软件的学习,因此,教材中软件相关内容的安排就尤其重要,不仅要有这样的章节,而且要通俗易懂,适合医学专业学生的初次统计软件学习,在每一种多元分析方法数据集的录入、软件实现的步骤、一些常用选择项的介绍、软件运行结果的每个部分的解读以及结合专业知识后的结论等各个方面都要有详尽的解释。
医学可以划分成很多不同的专业,如公共卫生、医药和临床专业等,就公共卫生专业又可以进一步详细划分成劳动卫生、儿少卫生和营养等专业。目前的医用多元统计分析教材没有具体针对各个专业的多元统计分析教材,能选择到和医学专业接近的教材充其量也就是医用多元分析的教材了,因此,通过教材提高学习的积极性还是存在一定的局限性,但这种局限可以通过案例教学来弥补。在授课过程中,授课教师可能通过案例式教学[3],选择和授课学生专业休戚相关的例子来进行讲解,就格外能吸引学生的注意力。
4 通过教学设计引导学生主动学习
多媒体技术在教学中的应用极大优化了教学过程[4]。随着多媒体技术的发展,教学过程中“传统的PPT教学”逐渐形成新的多媒体教学形式――微课件。微课件是指使用多媒体技术在五分钟内就一个知识点进行针对性讲解的一段视频或音频[5]。基于教学设计,微课件可用于难点讲解、内容小结等各个环节。如在教学导入阶段,教师根据新课知识点设计新颖的问题,通过简短的视频的形式展现。微课件以视频的形式吸引学生的注意力的同时,将教学问题引入,让学生带着问题去听完一堂课,从而起到引导学生主动学习、增强听课效果的作用。
布置课后作业也是一种很好的引导学生主动学习的途径。以往教学中教师一般也布置作业,但布置的作业大多是多元分析方法基本思想和原则之类的思考题。笔者在教学实践中,将课后布置作业题目设定为“收集适用本次理论课医用多元分析方法的自己专业相关数据,并预计数据分析后可能的结果”。学生在收集数据的过程中,就必须去主动思考这种多元统计分析方法的基本思想、适用原则等问题,并且会进一步产生通过软件分析此数据的欲望。在实习课上,除了教师规定的实习题目之外,学生一般都会主动完成自己专业数据的分析,和教师探讨此数据分析的结果和对专业的指导意义。
以上是笔者在多年医用多元统计分析课程教学中的几点体会,通过培养实践能力、激发学习兴趣、提高教学效率和引导学生主动学习等多种方法增强教学效果,培养学生独立分析问题、利用科学方法解决问题的能力,使其在未来的科研岗位上能很好地利用和分析医疗卫生领域的海量信息为人们的健康服务。另一方面,通过各种方式增强医用多元统计分析的教学效果,也促使授课教师自身能力素质得以全面提升,真正落实“教师为主导,学生为主体”的教育理念。
【摘要】科学技术不断进步,促使我国市场经济体制不断进行改革深化,企业财务管理的方式也呈现出多样化的趋势。在发展的过程中,由于企业财务管理的不完善和企业运营的问题,企业财务危机现象不断出现,现在越来越多的企业开始利用多元统计分析的方法进行财务风险统计,并及时进行危机预警。本文主要对于多元统计分析在企业财务语境中的应用展开论述,通过不同的分析方法以及多元统计分析对于企业财务预警的作用,为企业的财务危机预警提出意见和建议。
【关键词】多元统计分析 财务危机 应用
一、多元统计分析与企业财务危机预警
多元统计分析在在统计学中是一种综合性的分析方法,通过多个分析方式对于同一个对象进行全方位的分析,内容包括多种应用方式。通过多种方式的综合运用,在多个指标的共同参与之下,对于统计的规律进行揭示与挖掘,将这种多元化的分析手法应用于企业财务危机的预警中,是十分有效的,与现代企业管理的多元资金流和运作的资金链串接是有相同的运作模式的。
企业的财务危机主要是指企业在经营过程中由于无力按时偿还到期的债务而产生的危机和困难就是企业的财务危机,企业财务危机的出现有种种原因,管理不善、行业萧条、决策失误、名誉受损等等,都可能导致企业财务危机的出现,企业一般都是个体或者合营,依靠主要管理人员和决策人的共同努力发展壮大,所以对于管理人员的措施采纳和决策人的决定有严格的要求。一般来说,判断一个企业财务危机的常用标准是企业破产和在证券交易中面临的退市现象,注意,在证券公司面临退市的现象一般指的是上市公司,中国改革开放以后,证券行业发展迅速,企业的上市已经成为一个企业发展壮大的标识,所以本文研究的企业也包括上市公司。企业在生存发展的过程中,面临的财务危机是一项挑战,也是一项机遇,往往一个企业进行大刀阔斧的改革都是在企业财务危机之后,由于财务危机暴露了企业在发展过程中的弊端,所以企业在财务危机中能够顽强的生存下来,也就获得了成功的准备,将危机中显示出来的问题进行纠正,这样企业获得了良好的发展活力,更能在激烈的社会竞争力实现跨越式前进。
由于企业性质的不同,所以造成企业财务危机的原因也就不同,在企业财务危机预警的多元分析中,要根据企业的独特性采取相应的指标来完成分析,并且在模式模型选择过程中要根据企业财务危机的侧重点来进行选择,这样才能有针对性的提出分析的策略。根据我们选定的财务指标,利用聚类分析法对我国企业进行科学的统计分类;再用判别分析法构造预测判别模型,对其财务危机状况进行判定预测;最后利用主成分分析法提取主成分,计算各主成分的分数和综合得分,根据主成分综合得分对样本进行排序,以发现其财务危机状况,使用Excel电子表格中软件和统计分析软件SPSS来进行数据处理和建立多变量预警模型,这就是多元分析的主要步骤。
二、多元统计分析在企业财务危机预警中的应用
(一)样本和变量选取
在企业财务危机模型的建立过程中,对于企业的财务指标和参数,利用抽样方法进行选择。一般来说,选择的方式主要是随机抽样和对应样本法。在企业中,选取销售净利率、主营业务利润率、净资产收益率、资产净利率、每股收益(EPS)、应收账款周转率、存货周转率、总资产周转率、营运资本总资产比、资产负债率、流动比率、现金负债总额比(债务保障率)、现金流动负债比、现金流入流出比率、销售现金比率、每股净资产来建立指标体系作为分析变量等28个指标作为企业盈利、偿还等能力和资本实力的展现,也是全面地反映企业的财务状况的指标。在多变量模型的财务预警分析中,变量越多选择的余地越大,模型建立就越好。
(二)判别分析
根据样本和变量的选择,利用判别分析法建立企业财务危机的预警机制,在建立机制的过程中,可以根据研究对象创建一组函数,实现对于样本和变量的分析判别。一般来说,用的Fisher线性判别函数是判别分析中比较常见的。函数形式为:Yi=a1x1+a2x2+…+anxn+b(i=1,2,…,k)。其中k是判别组数,Y是判别分数或判别值;x1,x2,…,xn是因变量或预测变量;a1,a2,…,anj是各变量的系数,即判别系数;b是函数中的常数。通过这组函数对于基本的系数和常数进行计算,得出基本的财务危机指数、非财务危机指数以及中间指数。
在数字计算的过程中,判别分析建立的函数变量很多,将其中有显著性代表的变量函数作为典型例证进行分析计算,这样既能节省时间和效率,同时也能准确的代表了判别分析的结果。具体的判别分析方法:①采用一个系统默认的检验指标体系,以每一步λ统计量最小的进入判别函数,这样就能从整体上保证参数的合理性,计算的准确性也有了保证。②逐步判别停止的判据采用F值,当加入一个变量或者剔除一个变量后,对在判别函数中的变量进行方差分析,将因为变量的转换发生的系数变化统计下来,作为以后函数计算的重要数据。
③将获得的变量均值检验经过系统的分析,得出的结果作为费雪线性判别函数的系数。Fisher系数有被称为费雪线性判别函数的系数,在Fisher系数的系数表里,主要的指标要和变量均值检验表实现同步,这样在不断地分析计算过程中,才能得出Fisher线性判别函数模型。
由于模型中的6个变量从不同角度较好地反映了对于我国企业来说最重要的几个财务指标:盈利能力欠佳、资产周转速度慢, 尤其是应收账款回收慢,以及销售收入增长幅度小,经营现金流的短缺,这些都是极易导致财务危机的发生,最终影响企业生存的重要变量,通过这些数据的分析就能逐步实现财务危机的预警。
(三)主成分分析
在企业财务危机中,除了判别分析模型的建立之外,主成分分析也是较为普遍的方式。主成分分析主要是通过筛选和建立模型来实现,但是主成分分析法对于检测的指数和指标已经有了基本的规定,比如说企业重要的资金流动、盈利收益等,都是企业在财务危机预警里的主要成分。在变量较多的情况下,研究样本通常都比较复杂,因此需要利用主成分分析方法实施第二次筛选,使得模型精简化,这和判别分析的模型建立有同样的方法选择,选取适用的参数和指标来进行有针对性的研究。在企业财务危机分析中,具体是指,对企业收集的原始数据和财务指标进行标准化的处理,取平均为零,方差取1;然后,利用标准化的数据计算财务指标间相关系数矩阵R;最后,按照指标间的矩形计算规则,对于矩阵中的相关系数进行分析和计算。
三、多元统计分析对于企业财务危机预警的作用
本论文主要讨论了判别分析法和主成分分析法的使用,利用变量之间的关系通过函数建立企业财务危机预警模型。在企业财务危机预警的过程中,通过精确地数字来实现对于危机的提前处理,以数字化的指标来证明企业财务危机的可能性和危害性,为如何解决财务危机提供了方向性的指导。比如说,我们根据Fisher系数指标图看出,影响我国企业财务状况的指标主要是反映盈利能力的净资产收益率和资产净利率,反映资产管理能力的应收账款周转率和总资产周转率,反映成长能力的营业额收入增长率,反映获得现金能力的每股经营现金净流量,这几项数据在系数图里都能够看到,结合图示数据的分析,利用函数计算,就能有针对性的解决危机,减少危机的发生。
结语:本文主要针对企业财务危机预警中多元分析法的运用进行分析,借鉴前人的相关经验融合自己的想法与思路,对于应对企业财务危机提出自己的观点和建议。
摘要:随着我国社会经济的发展,企业经济效益随之不断地提高,采用多元统计分析对企业经济效益进行评估已成为企业迫切的需求。本文主要从多元统计分析评价企业经济效益的必然着手,归纳和总结了多元化统计分析评价企业经济效益的方法,并对多元统计分析方法在未来企业经济效益评价中的应用进行了展望。
关键词:多元统计 分析方法 经济效益 评价 应用
随着我国经济的快速发展,企业经济效益随之得到提高,企业经济效益的评价是将投入与产出的信息进行综合,从整体上评价企业的优劣,考核指标包括固定资产利税率、销售收入利税率、资金利税率、全员劳动生产率等,这些指标间往往此高彼低且相互间有联系,不能有效地评价企业经济效益。多元统计分析方法是利用信息技术将统计分析方法应用到社会科学的一门学科,研究多个对象(或多个指标)之间相互关联的统计规律性,是一种综合分析方法。在评价企业经济效益过程中,依托多元统计分析方法能够更加客观、全面的反映企业经济效益。
一、多元统计分析评价企业经济效益的必然性
我国自20世纪80年代开始评价企业经济效益,当时针对国有企业的两权分离的特点,特别制定了企业经济效益评价的十大指标体系,并在2002年进行了修改,综合考虑了企业投资人、债权人和社会效益三个方面。虽然此评价体系是根据新财务会计准则进行的调整,但仍存在一些不足之处,过于注重财务指标(总资产报酬率等8个指标),忽视了企业市场竞争力的非财务指标(市场占有率、存货周转率)。有些指标间有交叉或是关联,致使评价体系有一定的局限性,很难客观、全面地评价企业效益。假如资产负债率低的企业,它的自有资本高,同时如果净利润相当,那么它的资本收益率反而比资产负债率高的企业还要低。基于上述的情况和问题,全面考虑到企业市场竞争能力、企业财务能力、经营管理水平和企业发展能力,建立多元化企业经济效益评价体系,主要从获取利润的能力、开展资产运营能力、参与竞争的能力、经营管理能力和企业发展能力对企业经济效益进行全面系统评估。
二、多元统计分析在企业经济效益评价中的应用
统计学的不断发展为企业经济效益评价提供了支持,评价企业经济效益开始采用多元统计分析方法,它可以把多维度问题映射到单一维度,然后通过模糊决策、加权平均等方法全面地反映企业经济效益。在企业经济效益评价中应用较多的多元统计分析方法如下:
(一)主成分分析方法
所谓主成分分析是将具有多个相关的指标转换成新的相互独立的指标的一种多元统计分析方法。这种方法可以消除各指标间的相关性,以尽可能小的数据损失,反映尽可能多的指标,客观地描述样本的相对地位,减少主观的评价结果。利用主成分分析方法评价企业经济效益中,在评价企业的资产运营能力时,可以将多项的财务指标(总资产报酬率等8个指标)重新组合、分解,形成生产经营成果指标、资金利用效率和消耗资源指标三个新的相对独立的指标,然后将三个指标通过杜邦分析图进行分析即可。
(二)因子分析方法
因子分析方法可以看作是主成分分析方法的推广,也是企业经济效益评价较为常用的方法之一。因子分析方法能够将多个具有较复杂的关系的指标归纳为主要的少数几个指标的统计方法。此方法以多指标之间的相互关系为基础并加以组合,形成最少个数的独立新变量(因子),简化变量并能够避免不同变量权重设计的误差。例如评价企业经济效益时,可以将固定资产税率、资金利税率、销售收入利税率、资金利润率、固定资产产值率、流动资金周转天数、万元产值能耗、全员劳动生产率等综合为盈利能力(固定资产税率、资金利税率、销售收入利税率、资金利润率、固定资产产值率)、资金和人力利用因子(流动资金周转天数和全员劳动生产率)、产值能耗(万元产值能耗)三个因子作为考核企业经济效益的指标。
(三)聚类分析方法
聚类分析是将研究对象、数据进行分类的分析方法。首先根据研究对象的相似性来分类,按照一定的原则将相似元素归为一类,然后再将相似的样本进行合并,直到所有样本都归为一类。在企业经济效益评价中,可以将资产周转率、利息倍数、流动比率、应收账款周转率、速动比例、偿债比率、存货周转率等利用聚类分析方法将其归为企业资产运营能力进行评价。
(四)判别分析方法
与其他统计方法不同,判别分析是在分类确定的条件下,即事先已经知道了判别的规则和类型,在分析未知样品类型是,只需要遵循判别规则进行样品分类的多元分析方法。在进行企业综合效益分析时,如已经明确了资产运营能力的指标体系,只需要对指标进行加权分类,就可以判定不同企业资产运营能力的强弱。判别标准不同时,常用的判别方法是Fisher判别;按函数的形式,一般用线性判别。判别的方法可分为很多种,要结合企业的实际情况和评价指标,选择最能反映企业效益的判别方法。
三、多元统计分析评价企业经济效益的前景
由于多元统计分析方法是研究多个随机变量之间相互关系及内在规律的一门统计学科,应用到企业经济效益评价中,简化了错综复杂的评价指标,更加客观、全面、系统地反映企业经济活动效率。可以真实、完整地对企业在一定期间的经济效果进行判别,并确定企业经济效益的现状。多元统计分析方法还可以有针对性对企业资本运营效率、资源利用率等分项进行评价,提高劳动生产率和经济效益。我们可以通过对企业经济效益的多方面评价,寻找和挖掘企业的可利用潜力并预测企业发展的前景,促进企业经济效益和社会效益的提高。
四、结束语
多元统计分析针对企业经济效益评价体系中多项指标且错综复杂的情况,通过简化数据结构、或是将复杂变量转化为相对独立的新变量,在尽可能降低数据损失的情况下,将企业经济效益评价体积系统化、全面化。现代企业发展迅速且规模越来越大,采用多元化统计分析方法,不仅可以降低分析的成本,同时对稳定企业经济效益都有一定的作用。
摘 要:结合主成分分析、因子分析与聚类分析的思想,利用SPSS软件对大学生信用评估问题进行研究。利用网上问卷调查得到的126名本科生反馈信息,对大学生的信用度进行评估,建立大学生信用评估体系,得到大学生群体中女性的诚信度要高于男性,并且随着年级升高大学生的诚信度也逐渐增高的结论。
关键词:大学生;信用评估;主成分分析;因子分析;聚类分析法
引言
本文在国内外个人信用评价相关理论和生活经验的基础上,结合大学生相关特质,确定各指标的重要程度,并用层次分析方法确定各指标的评分值,构建大学生信用评价指标体系,通过对湖南农业大学本科生进行问卷调查,获得客观的原始数据;将多元统计分析中的主成分分析、因子分析和聚类分析作为主要研究方法,构建大学生信用评估模型,运用SPSS统计软件进行相关操作来评估大学生信用好坏情况,并验证所建指标体系的可行性。
一、研究方法
1.主成分分析。主成分方法由Hotelling于1933年提出,是利用降维的思想将多指标转化为少数几个综合指标的多元统计分析方法。主成分分析是对原有所有变量进行简化,建立尽可能少的新变量,使得这些新变量两两不相关,并在反映研究的信息方面尽可能保持原有的信息。
2.因子分析。因子分析是用于数据化简和降维的多元统计分析方法,是在主成分分析的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别,主要研究的是相关阵或协方差阵内部依赖关系。
3.聚类分析。聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。目标是在相似的基础上对收集的数据进行分类。
利用系统聚类与主成分分析和因子分析相结合的思想,分别将通过主成分分析和因子分析得到的各位同学的最终得分进行聚类,将聚类结果进行比较分析,得到大学生中信用度的集中趋势并进行深入研究。
二、大学生信用评估体系的建立
1.数据选取与处理。本文数据通过网上调查的方法获得,对湖南农业大学各年级本科生进行《大学生诚信情况调查问卷》随机问卷调查,共发放问卷126份,收回有效问卷126份,有效回收率达100%。通过调查问卷收集了大学生学习、经济、社会实践、生活、就业等六大方面诚信情况的数据。
将研究的六大因素作为一级指标、并设置具体问题作为二级指标,建立大学生信用评估体系,在此基础上借鉴国内外个人信用评价指标体系的研究成果和专家评分,同时根据生活实际,对各级指标的重要程度以0~10(分值越高,表示该因素对诚信更重要)进行评分,并赋予相应分值。
2.实证研究过程。首先用主成分分析法对19个变量信息提取主成分解释总方差百分比达到90%的前n个主成分,在操作过程中,发现抽取特征值大于0.6时,主成分解释总方差百分比达90.964%,满足原定的期望值,此时共提取了15个主成分,将得到的因子载荷矩阵复制到数据库中,用依次命名,再将ai对应的特征向量zi计算出来,从而计算各主成分yi,最后计算得到每位同学的综合得分y。再用因子分析来对数据进行处理。选择降维――因子分析,同样抽取特征值为0.6,得到90.964%的方差累积贡献率。
在运行后得到15个公共因子的得分,最后通过公式:
F=(8.359*FAC1_1+6.708*FAC2_1+6.459*FAC3_1+6.41*
FAC4_1+6.363*FAC5_1+6.246*FAC6_1+5.973*FAC7_1+5.777*
FAC8_1+5.725*FAC9_1+5.72*FAC10_1+5.503*FAC11_1+5.472*
FAC12_1+5.422*FAC13_1+5.414*FAC14_1+5.413*FAC15_1)/90.964
计算得到每位同学的因子得分F。用系统聚类法分别将主成分分析法和因子分析法得到的每位同学的因子分F分成三类:第一类,信用度高;第二类,信用度中等;第三类,信用度偏低。再对各类别中男女组成及年级组成进行分析,得到相关结论。
三、结果分析
模型的调试:
考虑到问卷调查是随机的,在男女及各年级的比例上存在较大的差距,得出的结果可能与实际情况不相符,因此,对实验结果进行进一步分析前,先要使这两组定性变量构成比例各自相同。
在调查的126份问卷中,参与调查的性别组成为男生57人、女生69人。因此,在调试时需将实验结果性别组成中的男生乘上126/114、女生乘上126/138,使男女总比例为1∶1,得到最终结果。
参与调查的年级组成为大一21人、大二39人、大三57人、大四9人。因此,需将实验得出的各类别在大一、大二、大三、大四数分别乘上126/84、126/156、126/228、126/36进行调整,得到最后的结果。
四、结果分析与讨论
表1 主成分分析调试后性别分析的结果
由表1可得,类别1是诚信度高的,有40人,类别2是诚信度中等的,有51人,类别3是诚信度较差的,有35人。其中,类别1和2共91人,占总体的70%,可见大学生中诚信度较高的人还是居多。在诚信度较高的人群里,男性占43人,女性占48人,可见女性诚信度要高于男性。
根据表2计算得,大一中类别1和2占大一总体的62.5%,大二中的类别1和2占大二总体的77.4%,大三中的类别1和2占大三总体的74.2%,大四中的类别1和2占大四总体的78.1%。可见,大学生的诚信水平是普遍较高的,诚信水平大致上随着年级的升高而增加,且大四学生的诚信水平最高。
因子分析法的结果研究的实验结果:
表3 不同分类下的人数
由表3可知,第三类为诚信度最低的,占总人数的80.2%;第二类为诚信度中等的,占总人数的9.5%;第一类为诚信度最高的人,仅占总人数的10.3%。运用因子分析得到的结果与主成分分析结果差异较大,且与现实不符,因此舍弃运用因子分析得到的结果。
结语
本文根据主成分分析与因子分析两种方法对大学生的诚信调查问卷进行分析,经对比可知,主成分分析的新变量是原始变量的线性组合,每个主成分都是由原有所有变量线性组合得到,但是因子分析不是对原始变量的重新组合,而是对原始变量进行分解,利用少数几个公共因子去解释较多个案观测变量中存在的复杂关系。最终发现主成分分析的结果更符合实际情况,从而剔除因子分析的结果,保留主成分分析计算的结果,得到大学生群体中女性的诚信度要高于男性,同时随着年级升高大学生的诚信度也逐渐增高的结论,这一结论与事实吻合,一般来说,女性比男性更有还贷意识,而且随着年级的升高学生的阅历也逐渐增加,使他们更有责任感。最后给银行发卡部门提出了有建设性的建议,即银行发卡时可注重向女性或者高年级学生多发卡,可减少男性或低年级学生的发卡数。
摘要:本文根据多元统计分析理论,构建了企业经济效益评价中的要素效益、要素效率、资产报酬和所有者权益报酬等相关因子的模型,并结合了相关统计理论,综合地分析了经过现行组合得到的企业经济效益,以实现对企业经济效益各个生产要素组合运行的量化评价,并借助聚类分析来检验和证实该方法切实有效。
关键词:经济效益评价;主成分因子;多元统计分析
企业的经济效益评价是指把反映企业经济效益的多项指标信息进行汇总,从整体上分析对象的好坏。其基本思想是将多个单项指标组合起来以便能够反映一个对象的整体,反映到数学统计分析的理论层面,就是把多维空间的样本投影并拟合到一维直线上,借助投影点研究样本的规律。本文对这种方法进行了一定的优化,使用主成分分析的方法以实现对企业经济效益的综合评价,既保留了原始变量的信息,又使得各主成分之间互不干扰,确保了企业经济效益评价的真实性。
一、多元统计分析在企业经济效益中的应用
综合评价企业经济效益的工具有很多,多元统计分析作为重要工具,可以把多维度的复杂问题映射到单一维度,再通过加权平均、模糊决策综合评价法等技术方法反映企业经济效益,得到综合性的评价结果。多元统计方法常见的有四种:1.聚类分析。聚类分析也称为群分析,是一种基于数据分类的分析方法,它的核心是将相似元素集合为一类,然后根据样本间的相似程度合并,依次合并减少分类,直到所有样本都合并为一类为止;2.判别分析。判别分析也是一种分类分析,与聚类分析不同,判别分析是已知样本类型和判别规则,然后对未知类型的样本进行判别分析的多元分析方法;3.主成分分析。主成分分析是将具有一定相关性的原指标重新组合、分解,形成一组新的无关联的综合指标,以尽可能小的数据损失,反映尽可能多的指标信息;4.因子分析。它是主成分分析的推广,区别在于它能够将随机的错综复杂的变量综合为主要的少数几个变量, 并以有限数量的变量(或因子)反映出原始数据的内在结构,减少了数据丢失,使评价分析更接近数据本身。本文主要运用的是主成分分析以及因子分析的多元统计分析方法,对企业进行经济效益评价,以体现多元统计分析在企业经济效益评价中的实际应用。
二、应用分析
(一)企业经济效益评价的指标分析
经济效益是企业在定量劳动消耗中产生的劳动成果。由于企业投入生产要素和劳动成果的不同形态,企业经济效益的评价指标有四个,分别是:周转性、报酬性、效果性和效率性。企业的周转性指标反映的是企业资金活动的效率,包含了流动资产和固定资产周转率。报酬性指标对应的是企业的资本收益能力,包括资产报酬率和所有者权益报酬率。效果性指标是企业在一定时间内设计生产的收益水平,有销售收入、产值、成本费用、人均利税率;效率性指标反映企业生产要素的利用效率,有人均产值、固定资产产值率和资金产值率。以上这11个指标共同构成企业经济效益评价体系,分别设定为x1,x2 ,..., x11。
(二)构建评价体系
为更好地构建企业的经济效益评价体系,把企业作为综合经济效益的评价对象,可以把其上一年的截面数据作为数据样本,通过计算机统计软件对这些数据进行标准化处理,求其相关矩阵R,再求R的特征根及特征向量。同时,依据统计分析理论得出主成分及贡献率,并选择贡献率最高的四个作为主成分因子来构成企业经济效益评价的组合指标。这四个因子包含了所有指标最多的信息量,分别设为F1、F2、F3、F4。第1主因子F1直接反映了企业的效果性和效率性,设置为企业的要素效益系数;F2能够反映出企业的要素效率,设置为企业的要素效率系数;F3能够反映企业的报酬率,设置为企业的资产报酬系数;F4能够反映企业的所有者权益报酬率,设置为所有者报酬系数。经过以上分析,四个主因子便构成了企业综合评价体系。
(三)企业经济效益的因子评价方法
因子分析是多元统计分析中的重要方法,在主成分因子分析的基础上,可以得出因子的得分模型,即将通过正交因子解转置矩阵乘以R系数矩阵得出原始变量的线性组合系数矩阵,进而得出因子得分模型和该分析样本的主因子得分结果,并对其结果进行了排列。根据各个因子的得分结果,可以得出以下结论:要素效益因子F1可以用来衡量企业投人生产要素的获利能力,从主因子分析得知在技术条件一定的情况下,扩大生产规模和增加市场销售份额可以影响企业的收益水平;要素效率因子F2反映企业资本和人力运用的效果和协调程度,通过主因子反映可以知道,通过资源配置的优化、运行等手段能够较好的提高企业的运营效率;资产报酬因子F3越高,说明资源配置和占用比较合理;所有者权益因子F4得分越高说明企业资产构成比例合理。
三、企业效益的综合评价
为此,我们可以把以上四个主成分因子特征值及贡献率作为权重来计算一个企业经济效益的总得分。经过计算和分析,将企业的综合得分进行排序。综合得分较高、排名靠前的公司的主因子单项得分基本也是较高的,说明这些公司在资产运用、市场营销和经营管理等方面做得较好,企业综合经济效益也较好。主因子得分较低的企业,说明它们的综合管理水平和资源利用较低,企业的市场竞争力不足。另外,从因子特征值、贡献率来分析经济效益的综合得分,可以根据主因子的单项得分来分析企业经济效益中的优势和劣势。
四、结语
利用数据统计分析的方法可以对反映企业经济效益的各个影响指标进行分类和总结,但是它并没有完全地考虑到类内因子之间的影响,而利用多元统计分析的方法并结合实际数据,采用主成分分析的方法来构建评价体系,可以实现对企业经济效益的多元化评价过程,更好地完成对企业综合效益的量化。
摘要:多元统计分析技术能够定量分析人口研究中各个变量之间的相互关系,讨论多元统计分析技术在人口研究中的应用及其重要意义。本文首先详细介绍了几种在多元统计分析中常用的统计方法,然后论述了我国目前人口研究中多元统计分析技术的应用现状,最后指出了我国人口研究在应用多元统计分析技术过程中存在的主要问题。
关键词:多元统计;人口研究;统计模型
随着统计学和统计软件的发展,统计分析技术被越来越多地应用于实际生活。我国作为一个人口大国,了解我国的人口状况是关系国计民生的一项重大工作。所以,研究多元统计分析技术在人口研究中的应用有着深远的意义。
一、应用于人口研究的多元统计方法
作为一门专业课程,多元统计分析提出了大量的统计方法。如多元线性回归分析、logistic回归分析以及因子分析和聚类分析等。
1.多元线性回归分析在人口研究中的应用
多元线性回归模型主要用于研究一种变量受多种因素影响时的状况。而在人口研究中,多元线性回归模型主要用于人口老龄化以及城乡收入水平的影响因素等问题。例如利用多元线性回归模型研究人口老龄化问题的分析步骤如下:
(1)通过分析与人口老龄化有关的变量,我们确定人均国内生产总值、养老保险人数,失业人口人数、人口密度和政府医疗支出作为老龄化问题的影响因素(依次用X1、X2、X3、X4、X5来表示),并通过抽样调查或查阅年鉴的方法获得回归分析所需的数据,采用多元线性回归的方法进行定量分析。
(2)建立多元线性回归模型:Y=A+b1X1+b2X2+b3X3+b4X4+b5X5+e.其中b1、b2、b3、b4、b5为回归系数,A为常数项,e为残差。利用SPSS进行逐步法分析确定系数及常数项。
(3)对各变量进行显著性检验,确定模型并结合实际意义进行分析。
2.logistic回归分析在人口研究中的应用
logistic回归分析的用途主要包括三个:一是寻找特殊因素因素;二是预测;三是判别,例如预测某一个体属于某一情形的概率。logistic回归分析在人口研究中主要用于人口预测。
3.因子分析和聚类分析在人口研究中的应用
因子分析是指从影响研究变量的众多影响因子中提取出公共因子的统计方法。因子分析能够将具有相同本质的影响因子归入同一个公共因子,从而减少研究变量的数目。聚类分析则根据研究对象的特征,对研究对象进行分类,从而达到减少研究对象的目的。因子分析和聚类分析主要用于研究人口迁移影响因素、人口发展水平等问题。
二、多元统计分析技术在人口研究中的应用现状
在20世纪80年代,我国的人口研究中很少使用多元统计分析技术。进入90年代后,随着各种多元统计分析方法的引入和统计分析软件的使用,统计分析技术在人口研究中得到了广泛的应用。多元统计分析技术能够定量分析经济因素、社会因素和人口因素之间的关系,从而更好地解释人口现象。
1.我国人口研究中多元统计分析的特点
我国人口研究问题中多元统计分析技术的应用呈现出多样化的特点,主要表现在统计方法的多样性和统计分析内容的多样性。前面提到的多元线性回归方法、logistic回归分析方法以及聚类分析等多元统计分析方法在我国人口研究中都有应用。统计分析内容更是涉及生殖健康、居住类型以及人均收入水平等生活的各个方面。
2.我国人口研究中多元统计分析数据特点
我国在人口研究中的多元统计分析数据主要来源于抽样调查和典型调查等,统计分析的单位主要是以个人和家庭等个体单位为主。在数据类型方面,我国人口问题研究中的多元分析数据以横截面数据为主,时间序列数据极少用到。
三、我国人口研究中多元统计分析技术存在的主要问题
由于多元统计分析技术在我国人口研究中的应用时间比较短,很多人口研究人员对多元统计分析技术也没有经过系统的学习,在实际应用中难免会出现一些问题。
1.人口研究中多元统计分析方法使用错误
统计方法主要由研究目的和研究数据决定。但在实际应用中,由于研究人员难以正确区分各个统计方法,从而出现随意选择的现象。通过查阅用多元统计方法研究人口问题的相关文献我们发现,在进行人口问题研究时使用最多的就是多元线性回归模型。虽然多元线性回归模型具有易于理解和分析简便的特点,但它主要是研究一个目标受多个因素影响时的情形。很多文献没有注意到这个问题,从而错误地使用了该方法。
2.多元统计分析中缺乏评价和检验
评价和检验是多元统计分析的一个重要内容,因为很多统计方法只有结合实际,才能更好地确定自己的模型建立是否恰当,才能更好地解释模型中各个变量的实际意义。但在人口研究的实际应用中,很多研究人员只是注重对统计结果的分析,而忽略了模型的检验和评价。
对模型的评价主要是指模型对观测数据的拟合程度,每一种多元统计方法都有相应的模型评价方法和指标。对模型的检验主要是指显著性检验,从而判断该模型中各变量之间的关系是否存在。因此,模型评价和检验是多元统计分析不可分割的一部分,读者也只有通过这些内容才能更好地理解人口研究报告中所描述的现象。然而通过统计可以发现,很多有关人口研究的统计报告都缺乏模型评价和检验者方面的内容。
四、结束语
多元统计分析中的很多方法都适用于人口研究。近年来,随着统计学科和计算机技术的发展,多元统计分析技术在人口研究中也得到了广泛的应用。我国人口研究对多元统计分析技术的应用呈现出多样化的特点,多元统计分析的数据来源以抽样调查和横截面数据为主。但由于我国人口研究中多元统计分析技术的引入比较晚,在实际应用中仍存在较多的问题需要改善。
【摘要】多元统计分析是统计专业的核心课程,由于多元统计分析方法的应用领域很广,所以统计专业教学计划要求全日制本科学生必须掌握基本的多元统计分析方法,并且能够用于解决实际问题.本文通过国内外多元统计分析课程教学现状对比分析,结合作者编写《应用多元统计分析》教材以及本人的教学实践,谈谈多元统计分析教学研究与实践.
【关键词】多元统计分析;教学研究;实践
多元统计分析是应用统计方法来研究多变量(或多指标)问题的理论和方法.它不仅是统计专业开设的一门重要的专业课程,也是非统计专业本科生、研究生开设的一门重要的基础课程.
如何深化多元统计分析课程教学改革,培养学生的科学思维能力、应用能力和创新能力,改革现有的教学内容和课程体系,具有重要的意义(文献[1]).
一、国内外该课程教学现状对比分析
当今国际上先进国家多元统计分析得到了非常广泛的应用(文献[2]).这与他们的教学模式有很大的关系.美国的统计事业是发展得最好的,各行各业,特别是医药业,统计的应用非常深入,当今很多统计思想和方法都是美国人提出的,这与美国多元统计分析教学特别重视动手能力和创新能力的培养是分不开的.日本目前统计教育改革的动向为多元统计分析教育个性化、活动化和实践化,提倡学生综合学习和选择性学习.近年来,世界各国纷纷将信息技术应用于统计学科中,十分重视计算机辅助教学的研究与实施.英国国家统计课程标准要求给学生提供适当的机会来发展并应用信息技术学习统计的能力.荷兰的统计课程标准提出了跨学科目标的概念,反映了课程综合的基本理念.总之,国外比较先进的国家,对统计教育都非常重视,并各有自己的一套教学模式.
我国传统的多元统计分析课程教学就是“数学知识+例子说明+解题”,这种传统的教学模式虽然使学生在一定程度上掌握了基础知识,提高了学生的计算能力、逻辑推理能力、应用能力,但我们也不难看出,当前多元统计分析在教学以及考核中都存在一些问题.比如,只注重理论上的教学,缺乏主动性和创造性,缺少实践环节等.学生感觉到学到的不能用到实处,学习往往是应付考试,也就难以激发学生的学习兴趣,所以这种传统的教学与国外的教育相比缺乏生动性与普及性,难以与时俱进.
综合国外先进统计教育理念,我们必须“博采天下之长,弥补我之短”,对于多元统计分析课程教学进行改革,以适应时代和社会发展的需要.
多元统计分析课程是在高维空间讨论问题,离不开复杂的计算.如果没有相关软件的支撑,手工计算几乎是不可能.因此,引入软件实验教学,使学生既掌握理论知识,又能合理利用软件进行实践操作,这不仅是社会对人才培养的需要,更是新形势下多元统计分析教学改革的必然趋势.
二、编写《应用多元统计分析》教材的实践
作者结合多年来的教学实践,深感一本内容简练但又实用的《多元统计分析》教材的重要性.随着我国高等教育进一步“大众化”,特别是相关软件的普及,学习“多元统计分析”的人越来越多,人们不再只满足于学习一些理论知识,而且大家学习它更重要的是作为工具借助计算机和相关软件进行数据处理和分析.《应用多元统计分析》教材(文献[3]),在介绍多元统计分析的有关概念、背景的基础上,突出统计思想,着重讲解常用方法,并侧重于应用,对一些严格的数学推导被略去而只列出结论(降低了数学基础的要求),读者学习时关键是理解这些结果,清楚它们的意义和背景.
考虑到作为一款免费软件,R软件具有丰富的资源、良好的扩展性和完备的帮助系统;另外,考虑到MATLAB在工程等领域中应用广泛性、在国内外各高等院校使用的普及性,本书的应用案例采用R软件和MATLAB,并给出了相应的程序.
《应用多元统计分析》教材(文献[3])共分十二章,在介绍多元统计分析的有关概念、背景的基础上,突出统计思想,着重讲解常用方法,主要包括:多元数据的表示、线性回归分析、逐步回归与回归诊断、广义线性模型与非线性模型、方差分析、聚类分析、判别分析、主成分分析、因子分析、对应分析、典型相关分析.注重体现多元统计分析在各个领域的应用,将应用案例贯穿于理论讲解的始终,并给出了R软件、MATLAB的相关程序.
三、教学研究的实践
以下我们通过《应用多元统计分析》教材(文献[3])中的几个例子,来看多元统计分析中如何从图形得到相应结论的.
例1 (服装标准制定中的变量聚类法)在服装标准制定中,对某地成年女子的各部位尺寸进行了统计,通过14个部位 (上体长,手臂长,胸围,颈围,总肩围,总胸宽,后背宽,前腰节高,后腰节高,总体长,身高,下体长,腰围,臀围) 的测量资料,获得各因素之间的相关系数表(见文献[3]155页的表7-4).请根据以上数据,按最长距离法对这14个变量进行聚类,并画聚类图.
请根据以上数据,按最长距离法对这14个变量进行聚类,其画聚类图(有关程序见文献[3]的156页),如图1所示.
图1 聚类图
说明 在图1中,编号1,2,…,14分别表示前面的14个变量(上体长,手臂长,胸围,颈围,总肩围,总胸宽,后背宽,前腰节高,后腰节高,总体长,身高,下体长,腰围,臀围).
从图1可以看出,人体的变量大体可以分为两类:一类反映人高、矮的变量,如上体长、手臂长、前腰节高、后腰节高、总体长、身高、下体长;另一类是反映人体胖瘦的变量,如胸围、颈围、总肩围、总胸宽、后背宽、腰围、臀围.
例2 (蠓虫分类问题)两类蠓虫Af和Apf已由生物学家W.L.Grogon和W.W.Wirth (1981)根据它们的触角长度、翅膀长度加以区分.已经测得9只Af和6只Apf的数据,具体数据见文献[3]205页的表8-7.如何依据以上数据给出一种方法正确区分两类蠓虫?
根据数据已经测得9只Af和6只Apf的数据,散点图和分类直线图(有关程序见文献[3]的207页),如图2所示.
图2 散点图和分类直线图
从图2 可以看出,已经测得9只Af和6只Apf数据可以用判别直线分为两类.
例3 (学生身体四项指标的主成分分析)在某中学随机抽取某年级30名学生,测得身高、体重、胸围、坐高,具体数据见文献[3]222页的表9-4.试对这30名学生身体四项指标数据画出主成分的碎石图,并从碎石图判断主成分的个数.
30名学生身体四项指标数据主成分的碎石图(有关程序见文献[3]的222-224页),如图3所示.
图3 碎石图
从图3 可以看出,取两个主成分比较合适.碎石图(或悬崖碎石图)是一种可以帮助我们确定主成分合适个数的有用的视觉工具,将特征值从大到小排列,选取一个拐点对应的序号,此序号后的特征值全部较小且彼此大小差异不大,这样选出的序号作为主成分的个数.
例4 (文化程度和就业观点的对应分析)利用20世纪90年代初期对某市若干个郊区已婚妇女的调查资料,主要调查她们对“应该男人在外工作,妇女在家操持家务”的态度,依据文化程度和就业观点(分为非常同意、同意、不同意、非常不同意)两个变量进行分类汇总,具体数据见文献[3]267页的表11-1.请根据以上调查数据画出文化程度和就业观点的对应分析图.
根据以上调查数据画文化程度和就业观点的对应分析图(有关程序见文献[3]的267页),如图4所示.
图4 对应分析图
对应分析图可以直观地来展示两个变量各个水平之间的关系.
结果说明: (1) 对于图4,主要看横坐标的两种点(就业观点与文化程度)的距离,纵坐标的距离对于分析贡献意义不大.(2) 从图4可以看出对该观点持赞同态度的是小学以下、小学、初中文化程度的,而大学文化程度的妇女主要持不同意或者非常不同意的观点,高中文化程度的持有非常不赞同或者非常同意两种观点.
四、结束语
多元统计分析既可以是统计专业核心课程,也可以是其他专业的专业课或基础课等.在该课程中培养学生的动手能力,对于该课程具有重要的意义.
多元统计分析是一门应用性很强的课程,要提高教学质量,学以致用,必须充分调动学生学习的主动性和积极性,采用多媒体教学、案例教学和实验教学相结合的多元化教学方法,强化相关软件的应用,改革考核方法,达到培养创新型人才的目的.
【文章摘要】
随着我国证券市场不断的发展,人们的金融意识和投资理财意识也不断加强。证券业的发展吸引了投资者对证券市场进行投资,但是由于我国证券业起步晚,各项制度法规还不健全,人们的思想水平没有达到一定水平,面对证券市场如此快速的发展速度难免会出现一些问题。本文针对证券市场中出现的问题,研究分析了多元统计分析方法在证券投资中的应用,并对证券市场发展提出一些建议。
【关键词】
证券投资;多元统计分析;应用
证券市场的发展也反映出了我国经济的发展,中国证券业在短短十几年的所做出的成就是发达资本主义国家在历经百年的坎坷之后实现的,这样巨大的成就是中国经济发展的骄傲,但是这其中也存在的巨大的问题。近年来随着证券业的不断发展,这些问题不断暴露出来,对整个证券市场和经济市场的发展构成威胁。为了能够减少这些问题的出现人们也在积极地进行各方面方法的研究,其中多元统计分析法就是非常重要的方面。
1 多元统计分析法的介绍
(1)概念:多元统计分析是从经典统计学中发展起来的重要分支,是一种综合性非常强的分析方法。多元统计分析方法,能够在多个对象和多个指标相互关联的情况下分析它们的统计规律,是数理统计学中的重要分支学科。
(2)内容
多元统计分析方法所包含的统计方法包括:多重回归分析、判别分析、聚类分析、主成分分析、对应分析、因子分析、典型相关分析、多元方差分析等。
(3)应用简介
多元统计分析方法主要研究的是某个客观事物中多个变量之间的相互依赖的统计规律性,并在R.A费希尔等多位统计学家的精心研究下得到了重大发展,到20世纪50年代,伴随着计算机科技的发展和普及,多种统计软件应运而生,多元统计分析方法在地质、气象、生物、医学、图像处理、经济分析等领域得到了广泛的应用,这些实际应用的发展也再一次促进了多元统计分析法理论的发展,使人们在使用多元统计分析法时越开越方便。
2 多元统计分析方法在证券投资中的应用
多元统计分析法是证券投资中非常重要的分析方法,它的理论内容包含了多个方面的理论方法,每个理论分析方法对证券投资有着不同的分析作用,应该对每个分析方法进行认真研究得出相关的结论,再应用到实际经济生活中。
2.1聚类分析在证券投资中的应用
(1)定义:聚类分析是依据研究对象的特征对其进行分类、减少研究对象的数目,也叫分类分析和数值分析,是一种统计分析技术。
(2)在证券投资中应用聚类分析,是基于证券投资的各种基本特点而决定的。证券投资中包含着非常多的动态的变化因素,要认真分析证券投资中各种因素的动态变化情况,找出合适的方法对这种动态情况进行把握规范处理,使投资分析更加的准确、精确。
1)弥补影响股票价格波动因素的不确定性
证券市场受到非常多方面的影响,具有很大的波动性和不稳定性,这种波动性也造成了证券市场极不稳定的发展状态,这些状态的好坏对证券市场投资者和小股民有着非常重要的影响。聚类分析的方法是建立在基础分析之上的,立足基础发展长远,并对股票的基本层面的因素进行量化分析,并认真分析掌握结果再应用于证券投资实践中,从股票的基本特征出发,从深层次挖掘股票的内在价值,并将这些价值发挥到最大的效用。影响证券投资市场波动的因素非常多,通过聚类分析得出的数据更加的全面科学,对于投资者来说这些数据是进行理性投资必不可少的参考依据。
2)聚类分析深层次分析了与证券市场相关的行业和公司的成长性
聚类分析是一种非常专业的投资分析方法,它善于利用证券投资过程中出现的各种数据来对证券所涉及的各种行业和公司进行具体的行业分析,这些数据所产生额模型是证券投资者进行证券投资必不可少的依据。而所谓成长性是一种是一个行业和一个公司发展的变化趋势,聚类分析通过各种数据总结归纳出某个行业的发展历史和未来发展趋势,并不断的进行自我检测和自我更新。并且,要在实际生活中更好的利用这种分析方法进行分析研究总结,就要有各种准确的数据来和不同成长阶段的不同参数,但是,获取这种参数比较困难,需要在证券市场实际交易和对行业和公司的不断调查研究中才能得出正确的数据。因此,再利用聚类分析法进行行业和公司分析和证券投资分析时要注重选取正确的、关键的指标进行检查,例如主营收入增长率、净利润增长率等指标,这样才有利于正确预测证券市场上股票的发展潜力。
3)在实际操作中更加直观实用
聚类分析是根据现代证券市场发展水平和特点发展出来的新的分析方法,这种分析方法的出现与现代的基本的投资组合理论形成了比较,突出了聚类分析方法更加贴近实际生活,更加直观、实用的特点,并且由于技术的发展,聚类分析方法在实际应用中所受到的局限较小,而且易操作,因此它的适用范围就比现资理论更加的广泛。
2.2主成分分析在证券投资中的应用
(1)定义:在统计分析中,主成分分析是一种分析、简化数据集的技术。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。主成分分析由卡尔・皮尔逊于1901年发明,用于分析数据及建立数理模型。其方法主要是通过对协方差矩阵进行特征分解,以得出数据的主成分(即特征矢量)与它们的权值。
(2)主成分分析的应用非常广泛,判别分析的分析方法就是通过对各种分类数据的研究,分析出自变量各组间存在的差异,并总结出差异性,判断哪一个自变量对组间差异的贡献是否完全,根据这些数据将自变量的转变方法进行样本归类。
1)降低影响证券投资市场变动的因素之间的互相影响
在证券市场中有非常多的因素在影响着证券市场的稳定,这些因素之间有着非常多的关系,相互影响、相互关联,但相互之间的影响也存在着非常多的影响。而主成分分析方法就是在对影响证券投资相互关系的因素中进行分析,并对原始数据指标变量进行认真分析,将其中重要的主成分因素概括出来,并进行转换形成相互彼此相互独立的成分,而且经过实践证明在影响证券市场投资分析中的指标间相关程度越高,主成分分析效果越好。
2)通过主成分分析减少指标选择的工作量
主成分分析的目的就是要通过对各种数据、因素的分析总结出相对各种因素的不同影响程度,总结总体因素中的主要影响成分,并总结出不同层次的影响因素梯度,在分析时采取逐级分析的方法,这样既可以抓住主要矛盾进行分析,也可以节省时间,并且提高分析的准确性,减少分析人员的工作量,因此,主成分分析法指标选择上的优势更加的突出。
3)由主成分分析法构造回归模型更加的精确、节省时间
在进行证券投资因素分析时,为了能够更加清晰准确的对模型中的相关数据进行分析,都要对各种数据进行模型处理,这样的处理方式可以提高整个证券投资分析的准确性,是模型更加易于做出结构分析、控制和进行证券市场变动的预报。
2.3因子分析
(1)定义:因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。
(2)应用
因子分析最主要的作用是确定证券投资组合的模型。因子分析将影响股票价格的各种因素看成是不同的变量,建立股价因子模型,利用各因子不相关性确定股票的分类,再分析股票的发展潜力的基础上确定出合适的证券投资模型。
3 总结
随着经济发展的不断加快,金融证券市场的发展也达到了又一个高度。我国证券市场的发展还不完善,暴露出来的诸多经济问题必须引起政府和社会的广泛关注。证券市场研究着也要积极进行证券市场的各种理论对市场的发展做出合理的预测和控制。多元统计分析方法是近年来应用比较广泛、科学的方法,它为整个证券市场的健康发展做出了辅助性作用。为了证券市场能够更好发展,多元统计分析方法也要进行积极创新,为将来的发展做出贡献。
[摘要] 中药质量控制的研究一直是中医药发展的热点和难点,也是制约中药走向现代化和国际化的关键问题之一。多元统计分析是适合中医药特点的分析方法,在中药质量控制研究中得到了广泛的应用。运用多元统计分析对中药质量控制研究中出现的多指标、多变量且彼此之间存在着一定相关性的数据进行分析,可发现隐藏在其中的规律或数据间的关系,从而服务于决策,以实现中药质量的有效评价。该文就多元统计分析在中药质量控制中的应用进行了综述,为其进一步研究提供了依据。
[关键词] 多元统计分析;中药;质量控制
中药是指在中医理论指导下,用于预防、治疗、诊断疾病并具有康复与保健作用的物质,包括中药材、中药饮片和中成药等。中药是我国中医药文化的瑰宝,并以资源丰富、疗效独特和副作用少等优势成为国内外关注的焦点。但长久以来,原始、单一的中药质量控制方法,一直制约着中药质量的提高,随着科学技术的发展以及各种新仪器的问世,应用于中药质量控制的方法和手段也不断增加,从原来单一的质控指标发展到现在的多质控指标,这使得中药质量控制标准全面提高[1]。但这些构成指标体系的多个指标又各有侧重地解释着该中药的质量,其间必然存在着多重共线性。比如,指纹图谱在改变单一指标性成分评价中药质量所明显存在片面局限性的同时,也暴露出它自身的问题,即在表现众多成分的指纹峰中,什么是重点?哪些峰是可以放弃的?现实的要求是既不能“片面”,但也不能“一把抓”[2]。如果用一元统计方法一次只能分析一个指标,分析多个指标时就会忽视了各指标之间存在的相关性,分析的结果不能客观全面地反映情况。多元统计分析[3-7]能在不损失信息的情况下,通过变换和构造模型,剔除指标间相互制约的成分,寻找一个简单综合指标,将这些指标反映的内容综合起来,使复杂数据简单化。且有文献报道,多元统计分析能在一定程度上达到数据挖掘的目的,同时它的一些思想和功能也能在数据挖掘的数据收集、数据清理环节发挥作用[8]。因此运用多元统计分析对中药质控研究中出现的多指标、高维和大量统计数据且彼此之间相关的数据进行分析,可发现数据间的内在规律,以实现中药质量的有效控制。
1 多元统计分析的涵义
多元统计分析是同时分析和处理多组变量,从整体把握事件的特征和发生规律统计分析方法,其核心内容是总体参数估计的修正和统计推断,具体表现出来就是各类统计方法,如主成分分析、因子分析、聚类分析、判别分析和典型相关分析等[5]。多元统计分析应用于中药质量控制的研究有以下几种优势:①多指标性只有用相互关联的多个指标(即描述现象的多个方面)才能够对事物或现象的全貌有所了解,这是多元统计分析在中药质控研究多个指标的最大优点;②定量性多元统计分析就是用数学的方法来研究影响中药质量的多个指标之间相互依赖关系以及内在统计规律性的分析方法;③复杂性和数据计算量大等特点这是多元统计分析适宜于分析研究中药质控中出现的繁琐复杂数据的基础[9]。
2 多元统计方法在中药质量控制中的应用现状
多元统计分析广泛应用于经济管理、医学、教育、生物等诸多领域,其中以中医药为检索范围,在已检索到的运用各类统计方法的51 792篇文献中,包括多元统计方法的文献已达25 279篇,说明多元统计方法已在中医药研究中得到了广泛应用。而统计学理论和中医药理论客观存在的相合性,也说明了多元统计方法在中医药研究中的应用不仅是可行的,也是科学的[10]。运用多元统计分析对影响中药质量的多方面因素进行综合分析和评价,以实现对中药质量更准确,更全面地控制。下面分别介绍几种主要的多元统计分析方法近年来在中药质控中的应用。
2.1 主成分分析 主成分分析的定义为利用数学降维方法,寻找新变量替代旧变量群,新变量之间互不干涉,可独立进行分布统计,是一种将多数相关变量群替换成少数无关变量的方法[5]。主成分分析法能过滤虚假信息,减少无关指标的影响,已普遍应用于中药质量标准研究数据的统计分析中,以确定中药资源的分类和聚类,并从中获取能用于中药分析鉴别的有用信息,然后进行分析、鉴别、判断,进而进行分类和优选[11]。王劭华等[12]采用主成分分析对24批不同产地车前子样品中的10个共有峰面积进行分析,以累计方差贡献率达86.45%选取3个主成分,由主成分综合得分排序可知,综合品质较好的车前子品种为大车前子和平车前子,其中综合品质最好的为江西吉水婆婆庙产的大车前子;根据车前子主成分投影图可以将车前和平车前种子与其他品种车前种子区分开来。王琴等[13]应用主成分分析对不同地区枸杞中多糖和金属元素之间的相关性进行分析,以累积方差贡献率达88.181%筛选出3个主成分,结果表明多糖和常量金属元素钙(Ca),镁(Mg),钠(Na),钾(K)是影响枸杞质量的重要因素,微量元素铜(Cu),锌(Zn),铁(Fe)也是不可忽视的因素;其主成分得分可用于不同产地枸杞子质量的综合评价,为以后不同产地枸杞的开发利用奠定了基础。
2.2 因子分析 因子分析又称为探索性因素分析,是根据相关性大小把原始变量进行分组,使同组内变量之间的相关性较高,而不同组变量间的相关性较低[3-4]。因子分析也是利用主成分分析的降维思想,可看作是对主成分分析的推广和发展,但是其因子分析对于所研究的问题是根据原始变量的信息进行重新组合,以试图用最少个数的不可测的所谓公共因子的线性函数和通过旋转使得来的新变量对每个原始变量更具有可解释性。朵兴红[14]采用因子分析对党参、细辛等7种道地药材中Ca,Mg,锰(Mn),Cu,Fe,Zn 6种微量元素进行分析,以方差的贡献率大于99.75%提取2个主因子,分析结果表明这6种微量元素均对防治心脑血管疾病有一定的疗效,为微量元素与中药功效关系的研究提供了科学依据。多杰扎西等[15]采用因子分析对11个不同产地枸杞子中Zn,Cu,Fe,Mn等微量元素之间的关系进行研究,以累计方差达92.236%提取3个主因子,结果表明第一主因子与变量Zn和Mn有高的相关性,是枸杞子中起络合作用的微量元素,也是决定枸杞子质量的基本微量元素;第二主因子在变量Cu元素上有最高的载荷系数,是通过影响生物体内的酶、激素、维生素等生物活性物质,而发挥药效作用的微量元素;第三主因子在Fe元素上有最高的载荷系数,是在氧化还原等许多代谢中起到重要作用的微量元素,这3个主因子能够反映枸杞子中微量元素的分布特征;不同产地枸杞子的综合评价结果,与实际分类和质量的情况基本相符,如列于质量好的第一类、综合因子得分分列第二的宁夏某枸杞研究所,其培植生产的枸杞子质量高,一直起到行业示范作用。
2.3 聚类分析 聚类分析又称又称集群分析,是根据研究对象特征对研究对象进行分类的一种多元分析技术,把性质相近的个体归为一类,使得同一类中的个体都具有高度的同质性,不同类之间的个体具有高度的异质性[6]。聚类分析能够充分利用原始数据信息,除常用于中药系列品种的分类外,还可以广泛地引用于真伪鉴别、成分浅析、质量评价、新旧工艺或不同炮制方法比较、寻找代用品及扩大药用新资源等方面[16]。辛海量等[17]采用聚类分析,对不同来源的蔓荆子、黄荆子、牡荆子近红外漫反射指纹图谱进行分析,聚类分析结果与传统植物分类结果一致。李寒冰等[18]对不同批次的板蓝根抗病毒效价值进行聚类分析,聚类结果与常规质量等级分类一致,结果表明应用抗流感病毒效价检测方法,可以实现对板蓝根药材的质量控制。鄢丹等[19]采用生物热活性检测方法,以黄连道地优级药材为工作参照物、第一指数生长期生长速率常数(k1)为反应值,以量反应平行线(3・3)法设计试验,对7批不同产地的黄连样品的生物效应(效应谱和效应值)进行测定,并采用聚类分析对黄连的生物效价值进行分析,结果表明不同产地黄连的生物效应值存在差异,并以此划分的典型道地产区、一般道地产区和一般主产区,与传统对黄连的道地产区和主产区划分基本一致,生物效应值具有较强的产地专属性和指纹鉴定意义,生物热活性检测方法可作为传统生物效价检测方法的补充和提高。
2.4 判别分析 判别分析是根据一定量案例的1个分组变量和相应的其他多元变量的已知信息,确定分组与其他多元变量之间的数量关系,建立判别函数,然后便可以利用这一数量关系对其他未知分组类型所属的案例进行判别分组,主要包括距离判别、Fisher判别和Bayes判别分析等[6]。在实际应用中,当已知了类别的判别问题时,应选择判别分析;而当面对大量的数据,杂乱无章,而又需要分类时,应考虑聚类分析;二者有衔接之时,聚类分析可作为判别分析的预处理。白雁等[20]采用距离判别分析对来源于山东、山西和焦作的生地黄近红外漫反射指纹图谱进行分析,结果表明欧氏距离在0.6以上时生地黄被分为5类,其中山东因样品差异比较大,分成了3个区域,其他2个区域为山西和焦作样品,分类结果与实际基本一致,且15批验证集样品的预测集正确率为85%以上,为地黄产地鉴别方法提供1种新技术。吴文莉等[21]采用Fisher判别分析对105种中药中42种元素含量进行分析,以42种元素含量的百分位值,对依据全国大中专院校教材《中药学》查询的105味药物的寒、热、温、凉四性,建立4类Fisher判别方程,整体回判复合率为80.9%,研究表明通过分析测定中药中所含微量元素的量,能在一定程度上反映中药的性能,为进一步研究中药的物质基础提供指导。
2.5 典型相关分析 典型相关分析是对每组变量做1个线性组合,即为这组变量的综合变量,然后研究2组综合变量的相关,通过少数几个综合变量来反映2组变量的相关性质[7]。典型相关分析也是利用降维思想,主要对质量评价、成分浅析、新旧工艺或不同炮制方法比较、寻找代用品及扩大药用新资源等方面进行研究。王伽伯等[22]采用典型相关分析,对大黄炮制减毒机制和化学成分改变间的相关性进行探讨,结果表明炮制可降低大黄肝肾毒性,其机制与结合蒽醌和鞣质类成分的下降有关,其中与游离和结合态的芦荟大黄素及大黄素甲醚相关性最强;在肝肾生化功能指标中,血清谷丙转氨酶(ALT)和肌苷(CREA)对肝肾毒性较敏感,可作为临床监测指标,为大黄炮制工艺的优化及肝肾毒性临床监测指标的筛选提供了方法参考。卢林耿等[23]对利用典型相关分析,对中药复方制剂工艺因素和药物成分间的关系进行了分析,结果表明大黄素和淫羊藿苷受制剂工艺影响较大,而芍药苷几乎不受影响;煎煮时间越长,大黄素和淫羊藿苷含量越低;加水量越多,大黄素含量越低,而淫羊藿苷含量越高;浸泡时间与这3种成分的含量成反比,但其影响作用较小,典型相关分析在中药复方制剂工艺研究中的应用有其重要的价值。
2.6 多元统计的联合应用 近年来,不仅单一多元统计分析得到广泛应用,多种统计方法的联合运用也得到快速发展,它能够更客观地实现中药质量的全面控制。王海波等[24]利用因子分析、聚类分析对黄芪中的无机元素含量进行分析,因子分析和聚类分析法的研究都表明黄芪主要判别元素确定为K,Mg,Na,为从不同分析角度实现黄芪饮片的质量控制提供了依据。王晓燕[25]将寒性、热性各10味植物药所含的多糖成分水解成单糖,并测定单糖的HPLC图谱,利用主成分―线性判别对该HPLC图谱进行分析,20味中药判别结果与已知药性完全一致,表明中药寒热药性与所含的多糖成分存在明显相关性;主成分―线性判别可对中药药性进行判别,且判别准确率高。尹海波等[26]利用主成分分析和聚类分析,对10个不同产地的牛儿苗样品中24种无机元素的指纹图谱进行分析,以总方差贡献率为91.5%选取前5个因子,主成分分析得出其特征元素为铝(Al)、铊(Tl)、钡(Ba)、铁(Fe)、镧(La)、铈(Ce)、锂(Li)、镓(Ga)和钯(Pd),聚类分析将路边生长和山坡生长的牛儿苗样品聚为一类,结果表明元素的分布特征与牛儿苗的生态和产地呈一定的相关性。鄢丹等[27]利用相关分析对盐酸小檗碱和不同产地黄连样品的生物热动力学参数(包括生长速率常数、产热量、生长期最大产热功率和达峰时间),和常规抑菌活性评价指标抑菌圈直径进行分析,结果表明生物热动力学法可用于黄连抑菌活性的测定;对不同产地黄连药材的抑菌效价进行聚类分析,结果将不同产地的黄连聚为一类,为利用生物热动力学法和抑菌效价测定法共同实现黄连抑菌活性评价提供依据。
3 小结和思考
综上所述,多元统计分析能够用来进行中药资源的分类、优选、真伪鉴别、质量评价、成分浅析、新旧工艺或不同炮制方法比较、寻找代用品及扩大药用新资源等方面。虽然多元统计分析得到了广泛应用,但仍存在一定的不足,比如主成分分析在简化数据降低维数的过程中又有可能丢失信息;因子分析在采用的是最小二乘法计算因子得分时,此法有时可能会无效;典型相关分析是在原始变量服从多元正态分布,样本容量至少要大于原始变量个数,且原始变量组内要有一定的相关性等前提下进行的,在实际应用时要根据各种分析方法的优缺点和它们之间存在的内在联系及区别,选择合适的分析方法,以实现中药质量更客观有效的全面控制。
多元统计分析在鉴定中药的真伪和质量优劣方面的研究工作已取得了可喜的进展[28],但其研究尚未成体系。我们能否以常用的中药道地优级药材和其他产区的药材为模型进行研究,建立一个常用中药材真伪鉴别和质量优劣评估体系。即首先选取合适的分析方法如色谱、质谱或生物测定方法等,提取药材的特征数据如化学指纹图谱、生物效价或生物效应谱等;然后对其中一种或多种特征数据进行主成分分析、聚类分析或判别分析等,在分析结果与常规质量等级分类一致的基础上,利用该特征数据建立一个常用中药材真伪鉴别和质量优劣评估体系,再运用相应的分析方法对未知类别的样品进行归属判别,对中药的质量进行有效控制,以期早日实现中药的现代化和国际化。
【文章摘要】
随着我国证券市场不断的发展,人们的金融意识和投资理财意识也不断加强。证券业的发展吸引了投资者对证券市场进行投资,但是由于我国证券业起步晚,各项制度法规还不健全,人们的思想水平没有达到一定水平,面对证券市场如此快速的发展速度难免会出现一些问题。本文针对证券市场中出现的问题,研究分析了多元统计分析方法在证券投资中的应用,并对证券市场发展提出一些建议。
【关键词】
证券投资;多元统计分析;应用
证券市场的发展也反映出了我国经济的发展,中国证券业在短短十几年的所做出的成就是发达资本主义国家在历经百年的坎坷之后实现的,这样巨大的成就是中国经济发展的骄傲,但是这其中也存在的巨大的问题。近年来随着证券业的不断发展,这些问题不断暴露出来,对整个证券市场和经济市场的发展构成威胁。为了能够减少这些问题的出现人们也在积极地进行各方面方法的研究,其中多元统计分析法就是非常重要的方面。
1 多元统计分析法的介绍
(1)概念:多元统计分析是从经典统计学中发展起来的重要分支,是一种综合性非常强的分析方法。多元统计分析方法,能够在多个对象和多个指标相互关联的情况下分析它们的统计规律,是数理统计学中的重要分支学科。
(2)内容
多元统计分析方法所包含的统计方法包括:多重回归分析、判别分析、聚类分析、主成分分析、对应分析、因子分析、典型相关分析、多元方差分析等。
(3)应用简介
多元统计分析方法主要研究的是某个客观事物中多个变量之间的相互依赖的统计规律性,并在R.A费希尔等多位统计学家的精心研究下得到了重大发展,到20世纪50年代,伴随着计算机科技的发展和普及,多种统计软件应运而生,多元统计分析方法在地质、气象、生物、医学、图像处理、经济分析等领域得到了广泛的应用,这些实际应用的发展也再一次促进了多元统计分析法理论的发展,使人们在使用多元统计分析法时越开越方便。
2 多元统计分析方法在证券投资中的应用
多元统计分析法是证券投资中非常重要的分析方法,它的理论内容包含了多个方面的理论方法,每个理论分析方法对证券投资有着不同的分析作用,应该对每个分析方法进行认真研究得出相关的结论,再应用到实际经济生活中。
2.1 聚类分析在证券投资中的应用
(1)定义:聚类分析是依据研究对象的特征对其进行分类、减少研究对象的数目,也叫分类分析和数值分析,是一种统计分析技术。
(2)在证券投资中应用聚类分析,是基于证券投资的各种基本特点而决定的。证券投资中包含着非常多的动态的变化因素,要认真分析证券投资中各种因素的动态变化情况,找出合适的方法对这种动态情况进行把握规范处理,使投资分析更加的准确、精确。
1)弥补影响股票价格波动因素的不确定性
证券市场受到非常多方面的影响,具有很大的波动性和不稳定性,这种波动性也造成了证券市场极不稳定的发展状态,这些状态的好坏对证券市场投资者和小股民有着非常重要的影响。聚类分析的方法是建立在基础分析之上的,立足基础发展长远,并对股票的基本层面的因素进行量化分析,并认真分析掌握结果再应用于证券投资实践中,从股票的基本特征出发,从深层次挖掘股票的内在价值,并将这些价值发挥到最大的效用。影响证券投资市场波动的因素非常多,通过聚类分析得出的数据更加的全面科学,对于投资者来说这些数据是进行理性投资必不可少的参考依据。
2)聚类分析深层次分析了与证券市场相关的行业和公司的成长性
聚类分析是一种非常专业的投资分析方法,它善于利用证券投资过程中出现的各种数据来对证券所涉及的各种行业和公司进行具体的行业分析,这些数据所产生额模型是证券投资者进行证券投资必不可少的依据。而所谓成长性是一种是一个行业和一个公司发展的变化趋势,聚类分析通过各种数据总结归纳出某个行业的发展历史和未来发展趋势,并不断的进行自我检测和自我更新。并且,要在实际生活中更好的利用这种分析方法进行分析研究总结,就要有各种准确的数据来和不同成长阶段的不同参数,但是,获取这种参数比较困难,需要在证券市场实际交易和对行业和公司的不断调查研究中才能得出正确的数据。因此,再利用聚类分析法进行行业和公司分析和证券投资分析时要注重选取正确的、关键的指标进行检查,例如主营收入增长率、净利润增长率等指标,这样才有利于正确预测证券市场上股票的发展潜力。
3)在实际操作中更加直观实用
聚类分析是根据现代证券市场发展水平和特点发展出来的新的分析方法,这种分析方法的出现与现代的基本的投资组合理论形成了比较,突出了聚类分析方法更加贴近实际生活,更加直观、实用的特点,并且由于技术的发展,聚类分析方法在实际应用中所受到的局限较小,而且易操作,因此它的适用范围就比现资理论更加的广泛。
2.2 主成分分析在证券投资中的应用
(1)定义:在统计分析中,主成分分析是一种分析、简化数据集的技术。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。主成分分析由卡尔・皮尔逊于1901年发明,用于分析数据及建立数理模型。其方法主要是通过对协方差矩阵进行特征分解,以得出数据的主成分(即特征矢量)与它们的权值。
(2)主成分分析的应用非常广泛,判别分析的分析方法就是通过对各种分类数据的研究,分析出自变量各组间存在的差异,并总结出差异性,判断哪一个自变量对组间差异的贡献是否完全,根据这些数据将自变量的转变方法进行样本归类。
1)降低影响证券投资市场变动的因素之间的互相影响
在证券市场中有非常多的因素在影响着证券市场的稳定,这些因素之间有着非常多的关系,相互影响、相互关联,但相互之间的影响也存在着非常多的影响。而主成分分析方法就是在对影响证券投资相互关系的因素中进行分析,并对原始数据指标变量进行认真分析,将其中重要的主成分因素概括出来,并进行转换形成相互彼此相互独立的成分,而且经过实践证明在影响证券市场投资分析中的指标间相关程度越高,主成分分析效果越好。
2)通过主成分分析减少指标选择的工作量
主成分分析的目的就是要通过对各种数据、因素的分析总结出相对各种因素的不同影响程度,总结总体因素中的主要影响成分,并总结出不同层次的影响因素梯度,在分析时采取逐级分析的方法,这样既可以抓住主要矛盾进行分析,也可以节省时间,并且提高分析的准确性,减少分析人员的工作量,因此,主成分分析法指标选择上的优势更加的突出。
3)由主成分分析法构造回归模型更加的精确、节省时间
在进行证券投资因素分析时,为了能够更加清晰准确的对模型中的相关数据进行分析,都要对各种数据进行模型处理,这样的处理方式可以提高整个证券投资分析的准确性,是模型更加易于做出结构分析、控制和进行证券市场变动的预报。
2.3 因子分析
(1)定义:因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。
(2)应用
因子分析最主要的作用是确定证券投资组合的模型。因子分析将影响股票价格的各种因素看成是不同的变量,建立股价因子模型,利用各因子不相关性确定股票的分类,再分析股票的发展潜力的基础上确定出合适的证券投资模型。
3 总结
随着经济发展的不断加快,金融证券市场的发展也达到了又一个高度。我国证券市场的发展还不完善,暴露出来的诸多经济问题必须引起政府和社会的广泛关注。证券市场研究着也要积极进行证券市场的各种理论对市场的发展做出合理的预测和控制。多元统计分析方法是近年来应用比较广泛、科学的方法,它为整个证券市场的健康发展做出了辅助性作用。为了证券市场能够更好发展,多元统计分析方法也要进行积极创新,为将来的发展做出贡献。