首页 | 小学 | 初中 | 高中 | 作文 | 英语 | 幼教 | 综合 | 早知道 | 范文大全 |
娱乐爆料 当前位置:唯才网 > 综合 > 娱乐爆料 > 正文 唯才网手机站

基于主成分分析的综合评价研究万方数据

时间:2016-12-06 来源:唯才教育网 本文已影响

篇一:基于主成分分析法学生成绩综合评价

基于主成分分析法的学生成绩综合评价

摘要:以贵州航天职业技术学院2011级社区管理与服务班在2011—2012学年的13门主要课程考试成绩为研究对象,借助统计软件进行主成分分析,计算出主成分得分,并按主成分得分对学生进行了排名。为使成绩评价更具科学性、客观性和合理性,还将平均分和综合分比对,进行综合评价与分析,为教学研究、学生管理及就业指导提供科学依据。

关键词:主成分分析法;学习成绩;评价

中图分类号:g455 文献标识码:a 文章编号:1001-828x(2013)07-0-03

一、引言

在经济全球化和社会分工越来越细化的当今社会,人力资源已成为人类的第一宝贵资源。作为高素质人才主要培养基地的高等院校,如何科学地评价大学生的综合成绩成为当前各高校在全面推进素质教育过程中所面临的问题之一。传统的以多门课程总平均分排名的评价方法,比较笼统,为了尽可能全面、科学地反映被评价对象的情况,往往需要选取众多的指标构成评价体系,但是,过多的指标不仅会增加评价的工作量,还会因评价指标间的相关性造成评价信息相互重叠、相互干扰,从而难以客观地反映被评价对象的真实水平。本文认为可以使用主成分分析法解决此类问题。

二、主成分分析方法简介

主成分分析,是利用降维的方法,将多个指标转化为少数几个综

篇二:基于主成分分析的企业创新能力评价研究

基于主成分聚类分析的企业创新能力评价研究

摘要: 本文选取18个与企业创新能力相关的指标,运用主成分分析法对中国31个省市区2011年的创新能力进行综合评价和排序,通过聚类分析法将各省市区企业创新能力按相似性进行分为4类地区,最后对主成分分析结果和聚类分析结果进行对比分析,研究表明: 关键词:企业创新能力;主成分分析;聚类分析;中国31个省市区 中图分类号:C939 文献标识码:A 文章编号:

1引言

随着知识经济的发展,企业创新能力已经成为企业的核心竞争力。与此同时,如何客观的评价企业创新能力也成为学界讨论的热门话题。从目前查阅的国内文献来看,评价企业创

[3]

新能力的方法主要为两种,第一模糊综合评价法,胡恩华、单红梅(2002)运用模糊综合

[4]

评价法对企业技术创新绩效进行整体的分析和综合评判;董岗、傅铅生(2004)采用德尔

[5]

菲法和多级模糊综合评价法为探究企业创新能力构建了评价模型;张国政、杨瑞海等(2002)建立了一套企业技术创新能力的指标体系,并运用模糊综合评价法进行了综合评价。

[6]

第二层次分析法与模糊综合评价法相结合,刘鸿渊、增艳琳(2007)运用层次分析和模糊

[7]

综合评价相结合的方法对四川某大型企业的创新能力进行了综合评价;沈飚(2010)运用

[8]

层次分析与模糊综合评价对企业技术创新效果进行了全面评价;陈晓慧(2002)分析了企业技术创新的内涵,经费投入、研发能力、人力资源、市场推广和管理能力等5方面提出评价技术创新能力的因素,并运用层次分析和模糊综合评价进行了综合分析。上述两种评价方法虽然能够对企业创新能力进行全面综合的评价,但层次分析法主观性较强,主观认识的差异会导致评价结果的不同;另外,模糊综合评价在计算上较为复杂,若指标过多或者指标体系涉及多级时计算较为困难。因此,本文运用主成分聚类分析的方法,利用中国31个省市区2011年的数据,对企业创新能力进行了实证分析。本文选取的评价方法具有以下优势:第一,主成分分析是将多个指标划为少数不相关的综合指标,并最大限度的反应原来指标信息的多元统计方法,其优点在于将多为变量将维,简化数据结构,给分析研究问题带来便利,并且其计算出的主成分之间相互独立减少了信息交叉;第二,聚类分析方法是按描述事物性质的变量之间的相似程度进行分类的方法,这类方法可以将多指标的数据进行很好的分类;结合上述优势,本文采用“主成分聚类分析法”对我国31个省市区的企业创新能力进行了实证分析,即先进行主成分分析,再依据各主成分得分和综合得分进行聚类分析。

2模型简介

2.1计量模型

设有n个观测对象,每一对象有m个指标因子xj(j=1,2,?,m),所得观测值为xij (i=1,2,?,n),构成原始数据矩阵X=(xij)n×m,每一样本有m个指标因子xj(j=1,2,?,m),所得观测值为xij(i=1,2,?,n),构成原始数据矩阵X = (xij)n×m。基本步骤如下: ①原始数据标准化

为了使综合评价的结果客观、合理,必须消除数量级和量纲不同带来的影响,通常采用的是标准化处理(标准化处理后的值为xij*):

xi?j?

xij?xj

Sj

(1)

式中:

xj

Sj

分别为第j个指标的样本均值和标准差,且

2??1n1S?x?xxj??xijj??ijj?

n?1ni?1i?1??(2)

n

??

1/2

②计算指标的相关矩阵

在标准化数据矩阵

?

X*?(xij)

的基础上,计算原始指标的相关系数矩阵R = (rij)m×m。

其中,rij是xi指标与xj指标之间的相关系数,且

1n??

rij??xkixkj?

n?1k?1

?xki?xi??xkj?xj??k?1

n

?xki?xi??xkj?xj??k?1

n

2

2

(3)

其中,i,j=1,2,?,m ③计算相关矩阵的特征根和特征向量

计算特征方程

R??I?0

,求出所有的特征根λ1≥λ2≥?≥λn≥0,相应特征向量tj=

(t1j,t2j,?,tmj)。

④确定主成分的个数

G(r)??ek

k?1r

当前r的个主成分的累计贡献率中选择前r个来进行评价分析。

达到85%时,在已确定的全部m个主成分

⑤求n个观测对象在前r个主成分上的得分

主成分得分是已标准化的原始数据在主成分所定义的新坐标系中的新数据,即

?

Yj??tkj?xk

k?1m

,j=1,2,?,r(4)

⑥对新数据(Y1,Y2,?,Yr)进行聚类分析

根据r前个主成分的得分进行聚类分析,确定每个类样品的排序,并进行综合评价。

2.2指标选取

本文选取的指标。参照2013年4月国家统计局社科文司《中国创新指数(CII)研究》课题组研究设计的评价我国创新能力的指标体系,课题组从创新环境、创新投入、创新产出、创新成效4个方面设计了3级指标体系共21个指标,一级指标为中国创新指数,包括4个二级指标,分别是创新环境、创新投入、创新产出、创新成效;二级指标创新环境共包括5个三级指标,分别是经济活动人口中大专及以上学历人数、人均GDP指数、信息化水平指数、科技拨款占财政拨款的比重、享受加计扣除减免税企业所占比重;二级指标创新投入共包括6个三级指标,分别是.每万人R&D人员全时当量、R&D经费占GDP的比重、.基础研究人员人均经费、R&D经费占主营业务收入的比重、有研发机构的企业所占比重、开展产学研合作的企业所占比重;二级指标创新产出共包括5个三级指标,分别是每万人科技论文数、每万名R&D人员专利授权数、发明专利数授权数占专利授权数的比重、每百家企业商标拥有量、每万名科技活动人员技术市场成交额;二级指标创新成效共包括5个三级指标,分别是新产品销售收入占主营业务收入的比重、高技术产品出口额占货物出口额的比重、单位GDP能耗、劳动生产率、科技进步贡献率。

考虑到本文研究的对象是企业,选取的指标应考虑到企业创新的过程,另外还要考虑数

据的获取性,对指标体系进行了修改,部分指标进行了替换,最终选取了18个指标,如表1所示:

表1:企业创新能力评价指标体系

W1.R&D人员中硕士以上学历占比(%) W2.人均主营业务收入(万元/人) W3.地方科技支出占地方财政支出比重(%) W4.享受研发加计扣除减免税(万元) W5.R&D人员全时当量(人年) W6人均R&D经费 (万元/人) W7.R&D经费占主营业务收入的比重(%)

W8.注册商标拥有数(个) W9.形成国家或行业标准数(个)

W10.新产品销售收入占主营业务收入的比重(%) W11.购买和引进国内外技术经费支出(万元)

W12.新产品产值占工业总产值比重 W13.高新企业技术减免税(万元)

W14.有效发明专利数(件) W15.新产品产值(万元) W16.新产品销售收入(万元) W17.新产品开发项目数(个) W18.有R&D活动的企业数(个)

数据来源:《2012年工业企业科技活动统计年鉴》

3实证结果

3.1主成分分析

本文采用主成分聚类分析方法,选取2011年度相关数据,对中国31省市区的企业创新

能力进行评价,主成分分析利用SPSS19.0软件进行计算,利用其自有数据标准化功能,对原始数据进行标准化。对累积贡献率如表2所示,因子载荷矩阵如表3所示,主成分得分计算结果与排名如表4所示。

由表2可知,相关系数的前4个特征值大于1,分别为:9.764、2.429、1.985、1.069四个公因子的累积贡献率为84.704%(接近85%),根据主成分分析法累积贡献率大于85%的原则,可以认为18个指标可以综合成4个主因子作为评价企业创新能力的主成分。

提取的4个主成分因子的载荷矩阵如表3所示,第一主成分F1在 W3.地方科技支出占地方财政支出比重、W4.享受研发加计扣除减免税、W5.R&D人员全时当量、W8.注册商标拥有数、W9.形成国家或行业标准数、W13.高新企业技术减免税、W14.有效发明专利数、W15.新产品产值、W16.新产品销售收入、W17.新产品开发项目数、W18.有R&D活动的企业数这11个变量的载荷值都很大,因此第一主成分是企业创新能力的主要反映,称之为企业创新能力因子;第二主成分F2在W1.R&D人员中硕士以上学历占比、W2.人均主营业务收入、W10.新产品销售收入占主营业务收入的比重、W12.新产品产值占工业总产值比重这4个变量的载荷值较大,因此第二主成分是企业创新环境的主要反映,称之为企业创新环境因子;

第三主成分F3在W6人均R&D经费、W7.R&D经费占主营业务收入的比重这2个变量的载荷值较大,因此第三主成分是企业创新投入的主要反映,称之为企业创新投入因子;第四主成分在W11.购买和引进国内外技术经费支出这个变量的载荷值较大,因此第四主成

分是企业技术依存的主要反映,称之为企业技术依存因子。

在确定主成分后根据SPSS19.0软件主成分计算结果给出的全国31个省市区在4个主成分上的得分,再利用Excel软件,将各主成分方差贡献率在累积贡献率中的比重作为计算综合得分的权重,最终计算出全国31个省市区企业创新能力的最终得分,如表4所示。

表2:主成分计算结果:累积贡献率

表3:主成分计算结果:因子载荷矩阵

W1.R&D人员中硕士以上学历占比(%) W2.人均主营业务收入(万元/人)

W3.地方科技支出占地方财政支出比重(%) W4.享受研发加计扣除减免税(万元) W5.R&D人员全时当量(人年) W6人均R&D经费 (万元/人)

W7.R&D经费占主营业务收入的比重(%) W8.注册商标拥有数(个) W9.形成国家或行业标准数(个)

W10.新产品销售收入占主营业务收入的比重(%) W11.购买和引进国内外技术经费支出(万元) W12.新产品产值占工业总产值比重 W13.高新企业技术减免税(万元) W14.有效发明专利数(件)

成份

1 .373 -.012 .700 .948 .955 -.074 .063 .931 .848 .595 .354 .402 .951 .874

2 .672 .590 .504 -.063 -.233 .265 .300 -.221 -.248 .596 -.065 .750 -.042 -.106

3 .032 -.207 -.151 .017 .064 .953 .943 .052 .125 -.197 -.064 -.216 -.001 .054

4 -.323 -.375 -.002 -.055 -.060 .032 .097 -.019 -.018 .288 .771 .305 -.102 -.145

表4:主成分计算结果:主成分得分地区名称 1.北京 2.天津 3.河北 4.山西 5.内蒙古 6.辽宁 7.吉林 8.黑龙江 9.上海 10.江苏 11.浙江 12.安徽 13.福建 14.江西 15.山东 16.河南 17.湖北 18.湖南 19.广东 20.广西 21.海南 22.重庆 23.四川 24.贵州 25.云南 26.西藏 27.陕西 28.甘肃 29.青海 30.宁夏 31.新疆

F1 0.55698 0.18053 -0.3294 -0.58158 -0.64693 -0.22112 -0.34515 -0.57291 1.19297 2.60422 1.84964 0.07744 0.20504 -0.63839 1.22112 -0.18214 -0.03495 0.07958 3.053 -0.55205 -0.74083 -0.08919 -0.24507 -0.646 -0.70987 -0.92106 -0.44705 -0.70312 -0.95307 -0.712 -0.74864

F2 3.13793 1.24285 -0.46968 -0.67456 -0.17371 0.06346 1.00566 -0.56834 2.23709 -1.10443 -1.52463 0.30941 -0.68795 -0.57991 -0.25141 -0.72171 0.07615 0.01322 -0.52575 -0.25805 0.3986 1.1655 -0.25514 0.07831 -0.69884 -1.28953 1.17555 0.10875 -1.00743 -0.06387 -0.15754

F3 -0.70159 -0.49924 -0.20555 -0.03476 -0.13105 -0.07207 -0.57522 -0.00821 -0.57069 0.19076 0.3005 -0.28902 -0.26 -0.10438 0.06224 -0.12707 -0.15098 -0.23297 0.33347 -0.21726 -0.42088 -0.53356 -0.22482 -0.31154 -0.17893 0.00642 5.20326 -0.3194 0.36251 -0.12334 -0.16664

F4 -0.51402 0.21884 -0.56342 0.03774 -0.97635 -0.40891 -0.5031 -0.20086 0.3282 0.08685 -0.25755 0.11205 4.52785 -0.18489 -0.46077 -0.26073 -0.07132 0.44393 -0.98366 0.34978 -0.5963 1.92289 -0.61682 -0.13412 -0.01248 0.29175 0.2935 -0.34361 -0.31506 -0.40307 -0.80634

综合得分 0.709323 0.257521 -0.34034 -0.4611 -0.50452 -0.16171 -0.15876 -0.45222 1.026641 1.430195 0.896975 0.066359 0.298223 -0.50507 0.67434 -0.25996 -0.03367 0.051054 1.7373 -0.37876 -0.48123 0.197129 -0.26141 -0.42823 -0.56485 -0.74121 0.614808 -0.47365 -0.71185 -0.48517 -0.55617

排名 5 9 18 22 26 15 14 21 3 2 4 11 8 27 6 16 13 12 1 19

基于主成分分析的综合评价研究万方数据

24 10 17 20 29 31 7 23 30 25 28

3.1聚类分析

在计算出综合得分后,再次利用SPSS19.0软件对主成分计算的结果进行聚类分析,考虑到仅用综合得分作为分类的依据信息量小,会有片面性。本文最终把全国31个省市区的四个主成分得分和综合得分作为聚类分析的依据,本次聚类采用分层聚类过程,聚类方法采用类减Ward法,距离测度采用得到系统聚类分析的谱系图,如图1所示。

篇三:基于主成分分析法的重庆市工业企业财务状况综合评价研究

龙源期刊网 .cn

基于主成分分析法的重庆市工业企业财务状况综合评价研究

作者:金冬雯

来源:《经济研究导刊》2014年第03期

摘 要:近年来,重庆市工业企业总体发展态势良好,特别是规模以上工业企业排名位居全国前列。在工业企业稳步发展的同时,企业的财务状况也应受到关注。只有企业内外部的同步健康发展,才有利于企业的长远发展,以及重庆市工业行业的长久发展。运用主成分分析法,按照行业分类对重庆市工业企业的财务状况进行综合评价,以了解重庆市工业企业的整体财务状况。

关键词:工业企业;财务分析;主成分分析

中图分类号:F275.2 文献标志码:A 文章编号:1673-291X(2014)03-0164-02引言

工业企业按照年主营业务收入水平可以分为规模以上工业企业和工业小企业,一般情况下,与工业小企业相比,在研究工业企业的发展状况上规模以上工业企业状况更稳定,且更具有代表性。

2012年,重庆市规模以上工业总产值达13 104.02亿元,比上年增长18%,规模以上工业增加值增长16.3%,高于三季度0.1个百分点,增速排名稳居全国第二。2012年,重庆市规模以上工业总产值分别是2002年、2006年的10.7倍和4.1倍,十年间翻了三番。从重庆市直辖以来的数据看,重庆市规模以上工业企业一直保持着高速发展,2006—2009年“一年一跃”,2011年突破万亿大关,2012年达1.3万亿,重庆工业经济总体实力在不断地快速壮大。

一、企业财务状况综合评价

1.企业财务状况综合评价的概念。所谓财务综合评价分析就是将企业偿债能力、资金营运能力、盈利能力等诸方面的分析纳入一个有机的整体之中,全面地对企业财务状况和经营成果等所有财务活动的过程及其结果做出科学的分析、评价和判断。

2.构建企业财务状况指标体系的原则。企业财务指标体系的构建所遵循的原则主要有以下两点:第一,可比性原则和实用性原则;第二,公开性原则与保密性原则。

二、主成分分析法的基本原理