您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > SPSS知识点总结―211重点软件知识点
SPSS绪论(1)数据文件的建立、导入与导出(1)数据文件的整理(2)数据转换(2)基本统计分析(基本描述和卡方检验)(4)均数比较(2)相关与回归分析(2)非参数检验(2)SPSS是软件英文名称的首字母缩写,原意为StatisticalPackagefortheSocialSciences,即“社会科学统计软件包”。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为StatisticalProductandServiceSolutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。输出结果十分美观漂亮(从国外的角度看),存储时则是专用的SPO格式,可以转存为HTML格式和文本格式。SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序,极大的方便了中、高级用户。SPSS基础:主要窗口及功能数据编辑窗口(dataeditor)结果输出窗口(viewer)程序编辑窗口(syntaxeditor)脚本编辑窗口(Script)数据编辑窗口(dataeditor)打开方式:启动SPSS后,数据编辑窗将首先自动打开在SPSS运行过程中建立新的数据文件,从菜单选择File—New---Data由数据窗口(DataView)和变量窗口(VariableView)组成,两个窗口切换单独显示数据窗口用于显示和编辑数据变量窗口用于定义、显示和编辑变量特征结果输出窗口(viewer)打开方式在第一次产生分析结果的SPSS过程后,结果输出窗口被自动打开打开新的结果输出窗,从菜单选择File—New---Output结果输出窗口(viewer)功能:SPSS统计分析报表及图形的输出窗口组成:窗口主菜单、工具栏、结果显示区、状态显示区在进行第一次分析时自动打开,也可手工打开;可以手工打开若干个可相互切换的viewer窗口;输出窗口可以关闭;状态栏上的!表示当前输出窗口窗口内容以.spo存于磁盘上程序编辑窗口(syntaxeditor)功能:编辑命令语句窗口内容以.sps存于磁盘上打开方式:第一次通过对话框选择SPSS过程时,击按钮paste,程序编辑窗自动打开;也可通过菜单打开file—new—syntax数据文件的建立、导入与导出1.数据文件的建立2.SPSS所处理的数据文件有两种来源:a)在SPSS环境下新建数据文件b)调用已建立的各种类型的数据文件在SPSS环境下建立数据文件:启动SPSS后,界面显示数据编辑窗在数据编辑窗内直接输入数据,保存后便形成SPSS数据文件--数据文件的结构二维行列结构,每行为1个记录或1个观察单位(Case),每列为一个变量(Variable)--定义变量SPSS数据文件是一种有结构的数据文件:定义数据文件的结构:1.name:变量名,是变量存取的唯一标志定义变量名的原则:变量名最长不超过64字节(32个汉字)(不推荐使用汉字,越简单越好)首字符必须是字母或汉字,不能以下划线或圆点结尾变量名中不能有空格或某些特殊符号,如!、?和*变量名不能与SPSS的关键字相同,即不能用all/and/by/eq/ge/gt/le/lt/ne/not/op/to/with等做变量名对变量名英文字母的大小写不作区分2.type:变量类型数值型:常用标准数值型(Numeric):默认类型8.2如:12345678、12345.67、-1234.56字符型(String):存储字符数据8位。如:beijing处理时用双引号扩起来日期型(Date):存储日期数据,如:20-AUG-1999注意:显示宽度不影响数据的存储3.width:变量宽度,默认为84.Decimals:小数位数,默认为25.label:变量标签,对每一个变量的含义进行解释,变量较多时非常重要!6.Values:变量值标签,对变量取值的水平进行定义7.Missing:缺失值8.Column:变量列宽,默认为8。9.Align:对齐,默认右对齐(Right)10.Measure:变量度量,包括三类:定量变量(Scale),定性变量(Nominal),等级变量(Ordinal)。该选项只用于统计制图时坐标轴变量的区分以及SPSS决策树模块的变量定义统计软件中数据的录入原则:1.同一观察对象的数据应独占一行2.同一个指标的测量值都应当录入到同一个变量中(除外配对数据和重复测量数据)3.最终的数据集应当能够包含原始数据的所有信息数据可保存为各种格式2.数据文件的整理(Data菜单)插入(Insert)观测值排序(sort):合并文件(MergeFiles):MergeFiles—AddCase(添加观察单位):例:newDrug(a).sav和newDrug(b).sav合并MergeFiles—AddVariables(添加变量):例:将ex(a).sav和ex(b).sav合并数据分类汇总(AggregateData):例:分类汇总:不同文化程度的家庭平均收入数据文件:休闲调查.sav选择观察单位(selectcases)选择观察单位(selectcases)变量加权(WeightCases)数据文件的整理(Transform菜单)计数统计(count)例:由家庭月收入产生一个分组变量group月收入1500group=0月收入=1500group=1排秩(Rank)例如:对sbp1(治疗前SBP)进行排秩排秩后产生新变量rsbp1,其中对于相等的变量值(称为结点ties)取平均秩次。本例中第2、3位的平均秩次为2.5。例:按家庭收入等分为五组第四章基本统计分析(descriptivestatistics菜单)Frequencies过程的特色是产生频数表;Descriptives过程则进行一般性的统计描述;Explore过程用于对数据概况不清时的探索性分析;Crosstabs过程则完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的检验也在其中完成。常用的描述统计量集中趋势指标(Centraltendency):均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)等离散趋势指标(Dispersion):标准差(Std.deviation)、方差(Variance)、全距(Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)百分位数指标(PercentileValues):四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cutpointsforequalgroups)、或直接指定某个百分位数(Percentiles)分布指标(Distribution):偏度系数(Skewness)和峰度系数(Kurtosis)。其他:M统计量(M-estimators)、极端值(outlier)等众数(mode):一组数据中出现次数最多的变量值称为众数。偏度系数(skewness):数据分布的不对称性称为偏态,偏态系数SK0时为右(正)偏,SK0时为左(负)偏。峰度系数(kurtosis):数据分布的平峰或尖峰程度称为峰态,峰度系统K0时为尖峰分布,K0时为扁平分布。K=0时为标准正态分布。(一)频数分析(Frequencies)最常用的统计分析之一功能:不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图,圆图等统计图菜单:Analyze—DescriptiveStatistics—Frequencies命令实例:对“diameter_sub.sav”中的“矢状面管径”变量作描述性分析并输出直方图(二)Descriptives过程是连续资料统计描述应用最多的一个过程,计算并列出一系列相应的统计指标。该过程特殊功能就是可将原始数据转换成标准正态评分值并以变量的形式存入数据库供以后分析。菜单:Analyze—DescriptiveStatistics—Descriptives命令(三)Explore过程可对变量进行更为深入详尽的描述性统计分析主要用于对资料的性质、分布特点等完全不清楚时,故又称之为探索性分析。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,如枝叶图、箱图等菜单:Analyze—DescriptiveStatistics—Explore命令例:对“clinicaltrial.sav”中的“plt1”按分类变量“group”进行探索性分析第五章:基本统计分析descriptivestatistics菜单(二)Crosstabs过程:Crosstabs过程用于对计数资料和有序分类资料进行统计描述和简单的统计推断在分析时可以产生2维至n维列联表,并计算相应的百分数指标。统计推断则包括了我们常用的检验、Kappa值,分层还可计算n维列联表的确切概率(Fisher’sExactTest)值。菜单:Analyze—DescriptiveStatistics—Crosstabs命令例为比较紫外线和抗病毒药物治疗带状疱疹的疗效,将带状疱疹患者随机分为两组,临床观察结果见下表,问两组的总体有效率有无差别?组别有效无效合计抗病毒组312556紫外线组55964合计8634120由于此处给出的直接是频数表,因此在建立数据集时可以直接建立三个变量:行变量、列变量和频数的变量group,effect,freq在默认情况下,每一行就是一条记录,这在多数情况下没有什么问题,但有时却非常麻烦,想想看如果你需要计算一个四格表卡方,有100例,如果每一行就是一条记录,你就需要输入100条记录!如果希望在计算过程中利用不同的变量对数据进行加权处理,就需要用到WeightCases对话框。例2clinicaltrial.savR×C表资料的卡方检验例某医院儿科504例就诊患者的病原学检测结果见下表,试分析病原学阳性率与年龄是否有关?配对计数资料的卡方检验和k系数检验例某抗生素治疗呼吸道感染的住院患者65例,治疗前后的细菌学检查结果见下表,试分析该抗菌素对治疗呼吸道感染是否有效?治疗前细菌学检查治疗后细菌学检查合计-+-20222+291443合计491665例116例患者的诊断结果见下表,使用k系数分析影像学诊断与病理诊断的吻合情况。CT检查病理学检查合计炎症恶性肿瘤炎症351146恶性肿瘤36770合计3878116分层资料的卡方检验分析口服避孕药与心肌梗塞的关系,考虑到二者之间的关系可能会受到年龄的影响,进行卡方分析时,要将年龄因素考虑入内,进行分层卡方分析oc*case*ageCrosstabulationCount2117382659854776123187258895183106102208服用OC不服用OCocTotal服用OC不服用OCocTotalage40岁=40岁病例对照caseTotal卡方检验值为10.729,拒绝原假设,所以结论为:去除年龄因素后,心肌梗塞与服用oc有关均数间的比较(CompareMeans菜单)Means过程对准备比较的各组计算描述指标,进行预分析,也可直接比较。One-SamplesTTest过程进行样本均数与已知总体均数的比较。Independent-SamplesTTest过程进行两样本均数差别的比较,即通常所说的两组资料的t检验。Paired-SamplesTTest过程进行配对资料的t检验One-WayANOVA过程进行两组及多组样本均数的比较,即成组设计的方差分析,还可进行随后的两两比较
三七文档所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
本文标题:SPSS知识点总结―211重点软件知识点
链接地址:https://www.777doc.com/doc-3545706 .html