您好,欢迎访问三七文档
1第三章统计整理第二章统计数据的搜集与整理教学目的通过本章的学习,了解统计数据搜集与整理的基本理论与方法,掌握各种方法的特性。基本要求要求灵活运用各种数据搜集的方式方法,并对所得数据进行加工整理,为以后各章学习统计分析方法打下基础。教学要点1、数据的计量与类2、型数据采集的方式方法;3、统计分组;4、变量数列的编制;5、统计数据的显示。教学时数2课时教学重点:统计数据的整理与显示教学难点:统计数据的整理与显示。第一节数据的计量与类型一、数据的计量尺度在计量学的一般分类方法中,依据对事物计量的精确程度,可将所采用的计量尺度由低级到高级、由粗略到精确分为四个层次,即名类尺度、顺序尺度、区间尺度和比尺度。1.定类尺度定类尺度(Nominalscale,亦称分类尺度、列名尺度等)是这样一种品质标志,按照它可对研究客体进行平行的分类或分组,使同类同质,异类异质。例如,按照性别将人口分为男、女两类;按照经济性质将企业分为国有、集体、私营、混合制企业等。这里的“性别”和“经济性质”就是两种名类尺度。名类尺度是最粗略、计量层次最低的计量尺度,利用它只可测度事物之间的类别差,而不能了解各类之间的其他差别。名类尺度计量的结果表现为某种类别,但为了便于统计处理,例如为了计算和识别,也可用不同数字或编码表示不同类别。比如用1表示男,0表示女;用1表示国有企业,2表示集体企业,3表示私营企业,等等。这些数字只是不同类别的代码,决不意味着它区分了大小,更不能进行任何数学运算。名类尺度能对事物做最基本的测度,是其他计量尺度的基础。2.定序尺度定序尺度(Ordinalscale,亦称序数尺度、顺位尺度等)是这样一种品质标志,利用它不仅能将事物分成不同的类别,还可确定这些类别的等级差别或序列差别。例如“产品等级”就是一种测度产品质量好坏的顺序尺度,它可将产品分为一等品、二等品、三等品、次品等;“考试成绩”也是一种顺序尺度,它可将成绩分为优、良、中、及格、不及格等;“对某一事物的态度”作为一种顺序尺度,可将人们的态度分为非常同意、同意、保持中立、不同意、非常不同意,等等。显然,顺序尺度对事物的计量要比名类尺度精确些,但它至多测度了类别之间的顺序,而未测量出类别之间的准确差值。因此,顺序尺度的计量结果只能比较大小,不能进行加、减、乘、除等数学运算。3.定距尺度定距尺度(Intervalscale,亦称间隔尺度、等距尺度、区间尺度等)是能测度事物类别或次序之间间距的数量标志,更具体些说,区间尺度是可将事物区分为不同类别,对这些类别进行排序,2并较准确地度量类别之间数量差距的一种计量尺度。该尺度通常使用自然或物理单位作为度量单位,如收入用人民币“元”度量,考试成绩用“百分制”度量,温度用摄氏或华氏的“度”来度量,重量用“克”度量,长度用“米”度量等。区间尺度的计量结果表现为数值。区间尺度的数值可做加、减法运算,例如,考试成绩80分与90分之间相差10分,一个地区的温度20°C与另一个地区的25°C相差5°C,等等。但不能做乘、除法运算。而且,区间尺度没有绝对的零点。4.定比尺度定比尺度(Ratioscale,亦称为比率尺度)的计量结果也表示为数值,跟区间尺度属同一层次,有时对两者可不作区分。定比尺度这种数量标志不仅能测度各类别的大小和多少,还有一个绝对零点(Absolutezero)作为起点。这个绝对零点是它跟区间尺度的明显差别,就是说,区间尺度中没有绝对零点,即使其计量值为“0”,这个“0”也是有客观内容的数值,即“0”水平,而不表示“没有”或“不存在”。例如,某个学生统计学的考试成绩为“0”分,这个“0”分是他的统计学的客观成绩,并不表示他没有考试成绩或没有任何统计学知识;一个地区的温度为0°C,这表示一种温度的水平,并不是说没有温度。而比尺度中绝对零点的“0”,表示“没有”或“不存在”。例如,一个人的身高为“0”米,表示这个人不存在;一个人的收入为“0”,表示这个人没有收入;一个产品的产量为“0”,表示没有这种产品;等等。现实中,大多数场合人们使用的都是定比尺度。定比尺度与上述三种计量尺度相比还有一个特性,就是可以计算数值之间的比值。例如,一个人的月工资收入为600元,另一个人的为300元,可以得出一个人的收入是另一个的两倍。但区间尺度由于不存在绝对零点,就只能比较数值差,而不能计算比值。比如,可以说30°C与15°C之差为15°C,而不能说30°C比15°C热一倍。可见,比尺度可以做加、减、乘、除法运算。上述四种计量尺度对事物的计量层次是由低级到高级、由粗略到精确,逐步递进的。高层次的计量尺度可以计量低层次计量尺度能够计量的事物,但不能反过来。显然,可以很容易地将高层次计量尺度的计量结果转化为低层次计量尺度的计量结果;将考试成绩的百分制转化为五等级分制就是一例。二、数据的类型1.按计量尺度分按照所采用的计量尺度不同,可以将统计数据分为定类数据、定序数据、定距数据和定比数据。统计数据是采用某些计量尺度对事物进行计量的结果,但采用不同的计量尺度会得到不同类型的统计数据。就上述四种计量尺度计量的结果来看,我们可以大体上将统计数据分为两种类型:定性的数据和定量的数据。定性数据(Qualitativedata,亦称品质数据)是说明事物的品质特征表现的具体类别,不能用数值表示;因这类数据由名类尺度和顺序尺度计量形成,故又可细分为分类数据和顺序数据。定量数据(Quantitativedata,亦称数量数据或数值型数据)是说明现象数量特征表现的,能够甚至必须用数值来表现;因这类数据由区间尺度和比尺度计量形成,故又可细分为区间数据和比数据。对不同类型的数据,可采用不同的统计方法来处理和分析,比如,对定性数据一般只采用分组法计算,分析各组的频数或频率,而对定量数据则可用更多的统计方法去处理,计算、分析更多的统计指标或统计量。2.按数据的收集方法分按数据的收集方法分类,可将统计数据分为观测数据和实验数据。观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下而得到的,社会经济现象的统计数据几乎都是观测数据。实验数据是在实验中控制实验对象而收集到的数据。如医药研究试验数据、动植物杂交品种试验数据等等。自然科学领域的大多数据都是试验数据。3.按数据的时间关系分按照被描述对象与时间的关系,可以将统计数据分为截面数据和时间数据。截面数据是指同一时间不同空间上的数据。时间数据是指同一空间不同时间上的数据。3第二节统计数据的整理与显示一、统计整理的意义和步骤(一)统计整理的意义1.定义统计整理,就是根据统计研究的目的,对所搜集到的资料进行科学的加工,使之系统化,条理化的工作过程。统计整理即包括对统计调查所得到的原始资料进行整理,也包括对加工过的综合资料,即次级资料进行再整理。2.意义统计整理在整个统计研究中占有重要的地位。统计整理的正确与否,将直接影响和决定着能否完成整个统计研究的任务。如果采用不科学不完整的整理方法,即使搜集到准确、全面的统计资料,也往往使这些资料失去应用价值,掩盖客观现象的本质,难以得出正确的结论。因此,必须十分重视统计整理工作。(二)统计资料整理的步骤第一步,设计和制定统计整理方案。第二步,对原始资料进行审核。第三步,对经过审核的资料进行分组、并结合汇总,计算出总体总量指标。第四步,将汇总计算的结果,以统计表或统计图的形式表现出来。第五步,对统计资料妥善保存,系统积累。二、统计分组(一)统计分组的概念统计分组就是根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分的一种统计方法。例如,将某一班级的全体同学按照性别划分为男、女两个组;对某市100家大型零售商店按照零售额、职工人数进行分组等。统计分组具有两个方面的含义:对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分;对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。例如,要了解我国人口状况,只知道总人口数量是不够的,而应将人口总体按照年龄、性别、民族、城乡、文化程度……等分组,才能进一步地深入地了解我国人口总体的年龄结构、性别比例、民族构成等。(二)统计分组的作用1.区分现象的不同类型2.研究总体的内部结构3.分析现象间的依存关系(三)统计分组的方法统计分组的关键问题是正确地选择分组标志与划分各组界限。前者主要是指品质标志分组,后者主要是指数量标志分组。1.分组标志选择的原则(1)要选择能够反映事物本质或主要特征的标志(2)应根据研究的目的与任务选择分组标志(3)根据现象所处的历史条件的变化选择分组标志2.统计分组的方法(1)按品质标志分组按照品质标志分组就是用来反映事物的属性,性质的标志作为分组标志,就可以将总体单位划分为若干性质不同的组成部分。例如,人口按性别、文化程度、民族、籍贯等标志分组;企业按经济类型、轻重工业、隶属关系,企业规模等标志分组等。(2)按数量标志分组按数量标志分组就是用反映事物数量差异的标志作为分组标志,将总体各单位划分为若干个组。例如,地区经济按国内生产总值分组、企业按销售收入分组等。4例如:某班学生基本情况调查表将上表资料按一定的标志分组后汉族12人,占60%1.按民族分组回族5人,占25%满族3人,占15%20岁5人,占25%21岁5人,占25%2.按年龄分组22岁2人,占10%23岁8人,占40%中共党员8人,占40%3.按政治面貌分组团员12人,占60%男生12人,占60%4.按性别分组女生8人,占40%(三)统计分组体系分组体系有下列形式:1.简单分组与平行分组体系姓名性别民族年龄身高政治面貌张三男汉211.52中共党员李四女汉211.43中共党员王五男回231.58团员贾六女汉231.51团员刘七男汉221.69团员杨小男回211.75中共党员孙非男回201.81团员王继男满231.65团员赵可女汉231.65中共党员武思男汉211.76团员兰第女汉231.48中共党员拉达女汉231.43团员向乐男回221.58中共党员项于女汉211.61团员可人男汉231.71团员梁草女回231.52团员保安男汉201.46中共党员马宝男汉201.82团员姜清女满201.58中共党员林可男满201.73团员5将社会经济总体只选择一个标志分组称为简单分组。对同一总体选择两个或两个以上的标志分别进行简单分组,排列起来,即成为平行分组体系。2.复合分组与复合分组体系复合分组是用两个或两个以上分组标志重叠起来对总体进行的分组。例如,将人口先按“性别”分成男、女两组,然后在男性和女性两组中分别按照“文化程度”划分为大学生及大学以上、高中、初中、文盲及半文盲如下五组:如果多个复合分组组成的体系就形成了复合分组体系。例如,为了认识我国高等院校在校学生的基本状况,可以同时选择学科、本科或专科、性别三个标志进行复合分组,并得到如下复合分组体系:三、分配数列(一)分配数列的概念与种类定义:在统计分组的基础上,总体中的所有单位按其所属的组别归类整理,并且按照一定的顺序排列,形成总体单位数在各组分布的一系列数字,称为分配数列,又称次数分配或次数分布。分配数列中,分布在各个组的总体单位数叫次数,又称频数。如果将分组标志序列与各组相对应的频率按照一定的顺序排列,就形成频率分布数列。分配数列有两个组成要求:一是分组;另一个是次数或比率。它可根据分组标志的性质不同,可以分为品质数列与变量数列。1.品质数列它是按品质标志分组的数列,用来观察总体单位中不同属性的单位分布情况。例如,表2.12000年我国人口性别构成情况人口性别分组人口数(万人)占人口的比重(%)男女653556122851.6348.37合计126583100(分组名称)(次数)(频数)品质数列的编制比较简单,但要注意分组时,应包括分组标志的所有表现,不能有遗漏,各种表现相互独立,不得相融。2.变量数列变量数列是将总体按数量标志分组,将分组后形成的各组变量值与该组中所分配的单位次数或频数,按照一定的顺序相对应排列所形成的分配数列。表2.2某班级统计学成绩分布表考试分数人
本文标题:第三章统计整理
链接地址:https://www.777doc.com/doc-2182848 .html