您好,欢迎访问三七文档
12019/12/18第1章的简要回顾统计学分类和基本术语描述统计和推断统计总体、样本、参数、统计量数据的度量和收集定类、定序、定距、定比数据的不同收集方法22019/12/18在获得原始数据资料之后,需要使用一定的方法对数据进行整理和综合,目的是从大量的原始数据资料中提炼所需要的信息,使之可以提供概要信息并能反映对象总体的基本数量特征,便于人们的理解和使用。表格和图形是整理和反映统计资料的主要工具§2.1分类数据的图表§2.2数值数据的整理§2.3数值数据的图表§2.4交叉表§2.5图表汇总和制作原则第2章统计表和统计图32019/12/18数据类型及图示数据类型与显示数值型数据分类数据分组数据汇总表茎叶图条形图圆形图环形图直方图箱线图折线图原始数据时序数据线图雷达图多元数据交叉表帕累托图频数分布表42019/12/18§2.1分类数据的图表汇总表汇总表列出了一系列分类数据的频率、总数或百分比,可以看出不同类数据间的区别1000美元用途的汇总表用钱做什么百分比(%)购买奢侈品、旅游、或礼物20向慈善机构捐款2还贷24储蓄31购买必需品16其它752019/12/18条形图在条形图中,每个条代表一个分类,其长度表示该分类的总数、频率或百分比§2.1分类数据的图表05101520253035购买奢侈品、旅游、或礼物向慈善机构捐款还贷储蓄购买必需品其它用钱做什么百分比(%)62019/12/18圆形图——用来表示总体各部分在总体中所占的结构比率。女性18%16%66%男性55%11%34%已婚孤寡或离婚单身已婚孤寡或离婚单身某企业员工的婚姻状况72019/12/18定序数据的图示—环形图(由Excel绘制的环形图)8%36%31%15%7%33%26%21%13%10%非常不满意不满意一般满意非常满意甲乙两城市家庭对住房状况的评价82019/12/18帕累托图在帕累托图中,不同类别的数据根据其频率降序排列的,并在同一张图中画出累积百分比图。帕累托图可以体现帕累托原则:数据的绝大部分存在于很少类别中,极少剩下的数据分散在大部分类别中。这两组经常被称为“至关重要的极少数”和“微不足道的大多数”。帕累托图能区分“微不足道的大多数”和“至关重要的极少数”,从而方便人们关注于重要的类别。帕累托图是进行优化和改进的有效工具,尤其应用在质量检测方面。92019/12/18帕累托图(续)表是一家大型注模公司的数据,该公司制造计算机键盘、洗衣机、汽车和电视机的塑料器件。表中数据是三个月中所有有缺陷计算机键盘的数据。原因频数百分数频数黑点4136.53破损1,03916.43喷射2584.08顶白83413.19划痕4426.99缺料2754.35银条4136.53缩水3715.87喷雾痕2924.62扭曲变形1,98731.42汇总6,324100.01*102019/12/18帕累托图(续)有序汇总表原因频率百分比累积百分比扭曲变形1,98731.4231.42破损1,03916.4347.85顶白83413.1961.04划痕4426.9968.03黑点4136.5374.56银条4136.5381.09缩水3715.8786.96喷雾痕2924.6291.58缺料2754.3595.93喷射2584.08100总计6,324100.01112019/12/18帕累托图(续)帕累托图05101520253035扭曲变形破损顶白划痕黑点银条缩水喷雾痕缺料喷射0102030405060708090100122019/12/18帕累托图(续)帕累托图的制作数据为例介绍帕累托图的制作方法,如所示。(1)在B2:C11中输入原始数据;(2)根据“频数”有高到低排序(如列F所示),同时计算累积百分比(如列H所示)(3)按住“Ctrl”健,选中如图2.7中所示的列E,列G和列H,然后点击“图表向导”,在弹出的对话框中点“自定义类型”,然后选择“两轴线-柱图”图表类型,根据向导就能生成如图2.7所示的帕累托图。132019/12/18§2.2数值数据的整理排序没有排序的数据很难看出数据的整体范围。排序是把数据从小到大(或从大到小)进行排列茎叶图用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶茎叶图类似于横置的直方图,但又有区别直方图可大体上看出一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息142019/12/18(实例)117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121【例2.3】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。152019/12/18树茎树叶78802234577788890012222333344466777889013344579910111213数据个数3132210茎叶图类似横置的直方图未分组数据—茎叶图(茎叶图的制作)图某车间工人日加工零件数的茎叶图162019/12/18未分组数据—箱线图(箱线图的制作)用于显示未分组的原始数据或分组数据的分布箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成其绘制方法是:首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接172019/12/18未分组数据—单批数据箱线图(箱线图的构成)中位数4681012QUQLX最大值X最小值图简单箱线图182019/12/18未分组数据—单批数据箱线图(实例)最小值107最大值139中位数123下四分位数117.75上四分位数128105110115120125130135140图50名工人日加工零件数的箱线图192019/12/18分布的形状与箱线图对称分布QL中位数QU左偏分布QL中位数QU右偏分布QL中位数QU图不同分布的箱线图202019/12/181.频数分布表例:2002年1月比特啤酒公司60个销售点的啤酒销售量(单位:桶)487152533641695847605329417281374358684273625944515347665952344973294716395843294652384680585167545758634940546158664750§2.2数值数据的整理212019/12/18比特公司啤酒销售量的分组统计销售量(桶)销售点数量(频数)频率(%)10~1911.720~2935.030~3958.340~491626.750~592033.360~69915.070~7946.780~8923.3合计60100分组统计整理后,将杂乱无章的60个原始数据压缩到8组,清晰地反映了更多的有用信息。222019/12/18比特公司啤酒销售量的分布特征05101520250—910—1920—2930—3940—4950—5960—6970—7980—8990以上频数比特公司啤酒销售量的频数分布232019/12/18——统计各组中的单位数(频数),并按一定顺序排列频数分布表可以反映总体的分布特征,是最有用的整理统计资料的方法频数分布表的构成要素分组形成的组别;各组中的总体单位数(频数);各组频数与总频数之比(频率)。1.频数分布表(续)242019/12/18统计分组的类型按品质(分类)标志分组目的在于揭示总体内部的性质和结构特点按数量(数值)标志分组——按某一数量标志的不同取值范围将总体划分为若干组。目的在于揭示总体内部的数量差异及其数量分布特征。252019/12/18品质(分类)数列频数分布表——按品质标志分组的频数分布表例:某企业职工人数统计表性别(分组)人数(频数)比率(%)(频率)男52656.08女41243.92合计938100262019/12/18数量(数值)数列频数分布表——按数量标志分组的频数分布表1.单项数列——以每一变量值为一组,适用于取值不多的离散型变量。例:某企业职工家庭人口分组统计表家庭人口(分组)职工户数(频数)比率(频率%)172.723814.9310541.245421.253112.25人以上207.8合计255100272019/12/182.组距数列——每组包含某一区间内的变量值适用于连续型变量和取值很多的离散型变量,组距数列是最重要的频数分布表例:某企业职工工资的分组统计月工资(分组)人数(频数)比率(频率%)1000以下15014.51000~150018517.91500~200025624.72000~300026225.33000~350012011.63500~4000545.24000以上80.8合计1035100数量(数值)数列频数分布表(续)282019/12/18组距数列的编制在编制组距数列时,需要解决如何分组、分组数量、组距、组限等问题组距数列中的几个基本概念重叠组限——相邻组的上下限重合。适用于连续型变量。但各组上、下限中有一个不包含再内。通常按“上限不在内”处理,即组区间是[a,b)的形式。注意:Excel在制作频数分布表时采用的是“上限在内”的规则。不重叠组限——相邻组的上下限不重合。适用于离散型变量292019/12/18例:离散型变量的分组(不重叠组限)销售量(桶)销售点数量(频数)相对频数(%)10~1911.720~2935.030~3958.340~491626.750~592033.360~69915.070~7946.780~8923.3合计60100比特公司啤酒销售量的分组统计302019/12/18某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合计50100312019/12/18例:连续型变量的分组(上限不在内)月工资(分组)人数(频数)比率(频率%)1000以下15014.51000~150018517.91500~200025624.72000~300026225.33000~350012011.63500~4000545.24000及以上80.8合计1035100某企业职工工资的分组统计322019/12/18组距数列的编制(续)——分组等距分组适用于数据基本呈单峰对称分布,或数据分布比较均匀的情况异距分组适用于数据的分布状态极度偏斜的情况,实际应用中采用哪种分组方法应根据数据的分布特点和统计分析的需要决定雇工人数企业数百分比1~194537.5%20~993125.8%100~1992319.2%200~4991512.5%500及以上65.0%合计120100%332019/12/18有些现象中各类型的数值差异很大,其标志值呈几何级数变化,则组距就应按几何级数确定例:某市零售商店年营业额分组统计年营业额(万元)商店数百分比(%)10以下205674.0410~10051518.55100~10001465.261000~10000481.7310000以上120.43合计2777100%组距数列的编制(续)——分组342019/12/18组距数列的编制(续)——分组分组的数量和组距应根据对象的特点和分析的需要决定。分组的数量通常应在5~15之间分组过多则难以反映总体的数量分布特征;分组过少则会丢失许多重要的统计信息组距:通常由组数和极差联合确定组的数目极差组距352019/12/18实际应用中分组的数量和组距应根据对象的特点和分析的需要决定。如果分组是为了揭示数据的分布
三七文档所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
本文标题:管理统计第2章.
链接地址:https://www.777doc.com/doc-2098225 .html