您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 主成分分析法在粮食产量中的应用
主成分分析法在粮食产量中的应用摘要主成分分析的基本思想是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原指标,并根据实际需要从中取几个较少的综合指标尽可能多的反映原来指标的信息。主成分分析法适合处理一些多变量,数据大的问题,具有广泛的应用。本文利用主成分分析法的方法对粮食产量问题予以分析。由于粮食产量受多个因素的影响,所以利用主成分分析法中降维的思想,通过多元回归分析,得到回归预测的模型。由于预测的模型存在共线的可能,所以进一步对所预测的模型进行检验,从而得到最优的模型。【关键词】主成分分析因子分析粮食问题PrincipalComponentAnalysisandItsApplicationsAbstractThebasicideaofprincipalcomponentanalysisistotrytoreassembletheoriginalindicatorsintoanewsetofseveralmutuallyindependentcomprehensiveindextoreplacetheoriginalindex,andaccordingtotheactualneedtobetakenseverallesscomprehensiveindexasmuchaspossibletoreflecttheoriginalindicatorsinformation.Principalcomponentanalysismethodissuitabletodealwithsomemultivariatedatabigproblem,withawiderangeofapplications.Inthispaper,theprincipalcomponentanalysismethodsareanalyzedforfoodproductionproblems.Becausefoodproductionaffectmultiplefactors,sotheuseofprincipalcomponentanalysisindimensionalityreductionideas,throughmultipleregressionanalysis,regressionpredictionmodel.Maybeduetothepresenceofthelinemodelprediction,thepredictionmodelfurthertestedtoobtaintheoptimalmodel.【keywords】principalcomponentanalysisfactoranalysisfoodissues目录一、引言.........................................................1二、主成分分析法的基本概念.................................1(一)主成分分析法的简介........................................1(二)主成分分析法的特点........................................1(三)主成分分析法的基本原理....................................1三、主成分分析法的应用......................................2(一)问题的提出................................................2(二)样本数据的选择............................................2(三)问题分析..................................................3(四)定义变量..................................................3(五)用SPSS进行主成分分析的步骤...............................3(六)模型的建立与求解..........................................4四、结束语......................................................9参考文献:......................................................9致谢.............................................................111主成分分析及其应用一、引言主成分分析也称主分量分析,是利用降维的思想,把多指标转化为少数几个综合指标。在实际问题的研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。本文主要针对我国的粮食问题,采用主成分分析的方法,利用SPSS软件对影响我国粮食产量的因素做出分析,从而得到最优的预测模型。二、主成分分析法的基本概念(一)主成分分析法的简介主成分分析法主要是将影响问题的多种因素简化,把有相关性的因素删除,通过剩下的主要因素来分析问题。例如,企业活动中的活动项目数与项目经费、经费支出等之间会存在较高的相关性;学生综合测评中的基础课成绩和选修课成绩、获奖学金次数等之间也会存在较高的相关性。因而我们通过运用主成分分析法来解决多变量的问题。主成分分析法Principalcomponentanalysis(PCA)是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,i个变量就有i个主成分。(二)主成分分析法的特点主成分分析法是在不丢失重要信息的基础下,把众多的变量缩减为几个主要因素,缩减后的变量通常有以下特点:1.缩减后的主要成分的个数小于原来变量的个数。2.缩减后的主要成分必须含有大部分的原始信息。3.缩减后的主要成分应该不再具有相关性。4.主成分具有命名解释性。(三)主成分分析法的基本原理主成分分析实际上是一种降维方法。主要思想是将原本具有相关性的多个变量pXXX,,,21(例如p个变量),通过降维,选出新的数量较少的不相关变量,组成新的综合性指标mF来代替原来指标。设1F为原变量中的第一个具有线性相关的主成分指标,即ppXXXF12121111,由数学知识可知,每一个主成分所提取的信息量可用其方差来度量,其方差)(1FVar越大,表示1F包含的信息越多。常常希望第一主成分1F所含的信息量最大,因此在所有的线性组合中选取的1F应该是pXXX,,,21的所有线性组合中方差最大的,故称1F为第一主成分。如果第一主成分不足以代表原来p个指标的信息,再考虑选取第二个主成分指标2F,为有效地反映原信息,1F已有的信息就不需要再出现在2F中,即2F与1F要保持独立、不相关,用数学语言表达就是其协方差0),(21FFCov,所以2F是与1F不相关的pXXX,,,21的所有线性组合中方差最大的,2故称2F为第二主成分,依此类推构造出的mFFF,,21为原变量指标pXXX,,,21第一、第二、……、第m个主成分。pmpmmmppppXXXFXXXFXXXF22112222121212121111根据以上分析得知:(1)iF与jF互不相关,即0),(jiFFCov。(2)1F是pXXX,,,21的一切线性组合(系数满足上述要求)中方差最大的,……,即mF是与121,,mFFF都不相关的pXXX,,,21的所有线性组合中方差最大者。)(,,,21pmFFFm为构造的新变量指标,即原变量指标的第1、第2、……、第m个主成分。三、主成分分析法的应用(一)问题的提出粮食是国家的根本,失去粮食或者缺少粮食不仅会对我们个人的生活产生影响,对国家乃至世界都会有很大的冲击。在我国,人口数量庞大,对粮食的需求量也相应增大,因此要使粮食品种的产和销、供与求满足动态的平衡,确保生产足够数量的粮食。而粮食的产量是随着投入生产要素的变化而变化的,反映出投入与产出之间存在着一种数量关系,这种关系可以用一种数学表达式表现出来,这种表达式常称作生产函数。而本文将利用主成分分析法,研究粮食产量与影响因素之间的关系,以此寻找粮食稳定增产的有效途径(二)样本数据的选择全文以2009年版的《中国统计年鉴2009》为资料来源,用到了1995年到2008年14年的数据作为样本点。利用SPSS软件,建立以粮食的播种面积、成灾面积、有效灌溉面积、农业机械总动力和农业化肥施用量为变量的多元线性回归模型,对影响粮食产量的因素进行实证分析。表1年份粮食产量(万吨)/Y播种面积(千公顷)/X1成灾面积(千公顷)/X2农用机械总动力(万千瓦)/X3有效灌溉面积(千公顷)/X4化肥施用量(万吨)/X519954666211006045824361184928135941996504541125484699138547503813828199749417112912534274201651239398119985123011378750145452085229640841999508391131614998048996531584124200046218108463546885257453820414620014526410608052215551725424942542002457061038914694657930543554339200343070994105450660387540144412200446947101606371066402854478463720054840210427838818683985502947663200649804104958410917252255750492820075016010563848992765905651851082008528711067933999082190584725239数据来源:2009年版的《中国统计年鉴2009》(三)问题分析每年的粮食产量受很多因素的影响,例如劳动生产力,环境气候变化,技术提高等,为了包含这些基本因素,本文选择了以农业化肥施用量、粮食播种面积、成灾面积、有效灌溉面积、农业机械总动力等为解释变量,以粮食产量为被解释变量。(四)定义变量Y:表示粮食产量(万吨);1X:表示粮食播种面积(千万顷);2X:表示成灾面积(公顷);3X:表示农业机械总动力(万千瓦);4X:表示有效灌溉面积(千公顷);5X:表示化肥施用量(万吨);(五)用SPSS进行主成分分析的步骤1.利用SPSS对模型进行初步拟合(1)将原始数据输入SPSS数据编辑窗口并命名。(2)在SPSS窗口点击分析,选择回归分析中的线性菜单项,调出线性回归的主界面。(3)将变量移入相应变量框。(4)方法选择:Enter。点击统计按钮,选择我们想要观察的选项,例如:回归系数的估计、模型拟合、共线性诊断等。(5)点击确定。通过以上步骤即可得到最终模型的拟合优度检验表、方差分析表、系数分析表、共线性诊断表等。2.利用SPSS进行因子分析(1)在SPSS窗口中点击分析,选择数据缩减中的因子分析菜单项,调出因子分析主界面。(2)将变量移入变量框。(3)点击描述,在相关矩阵中点击系数和显著性水平,然后点击继续。其他均为系统默认选项。(4)点击确定。通过如上步骤即可得到特征根和方差贡献率和因子载荷阵表。3.利用SPS
本文标题:主成分分析法在粮食产量中的应用
链接地址:https://www.777doc.com/doc-2729593 .html