您好,欢迎访问三七文档
第一节抽样推断概述第三节参数估计第二节抽样分布第四节抽样设计第五章抽样推断康师傅矿物质水“太酸”吗?成都消费者尹先生到四川大学华西附二院看望一生病的朋友,并给朋友买去一件康师傅矿物质水。就在他拿出来准备给朋友喝时,邻床一位姓金的先生提醒他说:这种水PH值偏低,呈酸性,不适合常喝,体质较弱的病人更不宜饮用。尹先生对此半信半疑,先后带了两瓶水到四川省人民医院和成都市二医院分别进行PH值检测。两次检测均显示,其PH值仅为5.8~6.2,根本达不到中国《生活饮用水卫生标准(GB5749-2006)》规定的6.5~8.5。10月6日,尹先生要求重庆顶津公司就康师傅瓶装水的“PH值”问题给消费者一个说法,并向记者反映了此事。尹先生的要求合理吗?康师傅矿物质水是真的“太酸”吗?一、抽样调查及其特点(一)抽样调查的概念第一节抽样推断概述指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会按照随机原则从调查对象(即总体)中抽取一部分单位进行调查,用调查所得指标数值对调查对象相应指标数值作出具有一定可靠性的估计和判断的一种统计调查方法。统计推断全及总体指标:参数(未知量)样本总体指标:统计量(已知量)抽样推断随机原则的实现抽签法是将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。随机数表法将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。计算机模拟法是将随机数字编制为程序存储在计算机中,需要时将总体中各单位编上号码,启用随机数字发生器输出随机数字,然后从总体中找到相应总体单位形成样本。并非所有的抽样估计都按随机原则抽取样本,也有非随机抽样总体随机样本非随机样本与总体分布特征相同与总体分布特征不同按随机原则抽取样本单位以样本的数量特征推断总体的数量特征抽样推断产生抽样误差,但抽样误差可以事先计算并控制抽样推断的特点与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总体数量特征的目的。我国在1994年确立了以周期性普查为基础,以经常性抽样调整为主体,同时辅之以重点调查、科学核算等综合运用的统计调查方法体系。不可能进行全面调查时有些事物在测量或试验时有破坏性,不可能进行全面调查.例如:灯泡耐用时间试验,电视机抗震能力实验,人体白血球数量的化验等等.不必要进行全面调查时例如:了解某林区有多少树,鱼塘有多少条鱼等。用于生产过程的质量控制例如:在产品成批或大量连续生产过程中,利用抽样调查可及时提供产品质量信息,进行质量控制。抽样推断的应用抽样推断的应用来不及进行全面调查时例如:农产量全面调查的统计资料数字要等收割完毕以后一段时间才能得到,而抽样调查的统计数字在收获的同时就可以得到,一般能早两个月左右,这对于安排农产品的收购,储存和运输等都是有利的.对全面调查资料进行补充修正时例如:有些国家在人口和农业调查中,根据调查项目的粗细要求不同,分别进行普查和抽样调查,有这两种调查所得资料不但便于核对差错,而且可以满足不同的需要.二、抽样推断的基本概念全及总体抽样总体就是调查对象,又称总体或母体,是由许多性质相同的调查单位组成,常用N表示全及总体的单位数目。又称样本或子样,是指从全及总体中按照随机原则抽取的那部分个体的组合。抽样总体的单位数称为样本容量,通常用n表示。1<n<N。n≥30称为大样本,n<30称为小样本.n/N称为抽样比.例如:在100万户居民中,随机抽取1000户居民进行家庭收支情况调查,其中的100万户居民就是全及总体,而被抽中的1000户居民则构成抽样总体。抽样推断的基本概念根据全及总体各个单位的标志值或标志特征所计算的反映总体某种属性的综合指标,又称总体指标。全及指标全及指标主要有四个:全及平均数总体是非标准差及方差总体标准差及方差全及成数是非标志总体分组单位数变量值具有某一属性不具有某一属性10合计—为研究是非标志总体的数量特征,令0N1NN指总体中全部单位只具有“是”或“否”、“有”或“无”两种表现形式的标志,又叫交替标志是非标志性别:男、女(非男)产品质量:合格、不合格1010是非标志总体的指标具有某种标志表现的单位数所占的成数NNP1不具有某种标志表现的单位数所占的成数NNQ010101NNNNNNNNNQP且有指是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重成数是非标志总体的指标PNNNNNfXfXP10101平均数PQPQPQQPPQNNNPNPffXXp22010212201)(标准差25.05.02max时,有当QP是非标志总体的指标PPPQ12方差PQPPPPPXVPP11标准差系数【例】某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。218.0)95.01(95.095.054002095400380203804000101PQPXNNQNNPNNNpP所以有:﹪,﹪,则件,件,件,己知是非标志总体的指标解:设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则NNXXX,,210N1N⒈总体平均数(又叫总体均值):miimiiiNiiffXXNXX111或miiimiiNiifXXfXXN1211211或⒉总体标准差:⒊总体方差:miiimiiNiifXXfXXN121212211或PNNQNNP1,01⒋总体成数(全及成数):⒌总体是非标志标准差:PQPPP1⒍总体是非标志的方差:PQPPP12有最大值时,当PQP5.0设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则nnxxx,,210n1n⒈样本平均数(又叫样本均值):miimiiiniiffxxnxx111或又称样本指标、统计量。指根据抽样总体各个单位的标志值或标志特征计算的综合指标,它是随机变量。抽样指标⒉样本单位标志值的标准差:⒊样本单位标志值的方差:miiimiiniifxxfsxxns121121111或miiimiiniifxxfsxxns12121221111或为自由度为的无偏估计2为的无偏估计pnnqnnp1,01⒋样本成数:⒌样本单位是非标志的标准差:pqnnppnnsp111⒍样本单位是非标志的方差:pqnnppnnsp1112为的无偏估计2P为的无偏估计P抽样的基本方法重复抽样从总体N个单位中随机抽取一个样本容量为n的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重新参加下一次的抽选。又称放回抽样不重复抽样每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又称不放回抽样.总体单位数N不变,同一单位可能多次被抽中。总体单位数减少n,同一单位只可能被抽中一次。根据取样方式不同,可分为:抽样方法的分类根据对样本的要求不同,可分为:考虑顺序抽样考虑各单位的中选顺序。ABC≠CBA例如:从1,2,3三个数中取两个数排成一个两位数,显然十位数取1,个位数取2,和十位数取2,个位数取1是完全不同的.综合起来共有四种抽样方法考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的重复抽样考虑顺序的不重复抽样不考虑顺序抽样不考虑各单位的中选顺序。ABC=CBA例如:从三个产品中抽取两个进行质量检验,第一个选1号产品,第二个选2号产品组成一组,和第一个选2号产品,第二个选1号产品组成一组没有什么差别.样本的可能数目考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样)!/(!nNNpnNnN1nNnC把填湖南风采35选7福利彩票号码看作一次抽样,则它属于哪一种抽样?中特等奖的概率是多少?(0—9选6呢?)不考虑顺序的不重复抽样,nNC8347680/1/1735C抽样调查的理论基础大数定律表明大量随机观象平均结果具有稳定性的性质。大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎100%的概率,期望样本平均数与总体平均数的绝对离差为任意小。1)(limXxPn抽样平均数和总体平均数的离差究竟有多大?离差不超过一定范围的概率究竟有多少?这个离差的分布究竟怎样?总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积.总体密度曲线b单位O频率/组距a概率密度函数0.0010.0090.0190.0650.130.1450.1920.1770.1470.0590.0360.0130.00700.050.10.150.20.2511.11.21.31.41.51.61.71.81.922.1其他00.0050.010.0150.020.025012300.020.040.060.080.10.1211.11.21.31.41.51.61.71.81.922.100.10.20.30.40.511.141.281.421.561.71.841.982.122.26中心极限定律如果变量总体存在有限的平均数和方差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于正态分布。一个任意分布的总体xX当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布xn样本均值的抽样分布与中心极限定理=50=10X总体分布n=4抽样分布Xn=165x50x5.2x当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X的数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)中心极限定理(centrallimittheorem)的分布趋于正态分布的过程X第二节抽样分布样本统计量总体未知参数样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量抽样分布样本统计量所有可能值的概率分布主要样本统计量平均数比率(成数)方差分布的形状及接近总体参数的程度抽样分布从同一总体中,抽取样本容量相同的所有可能样本后,计算每个样本统计量的取值和相应的概率,组成样本统计量的概率分布。(一)样本平均数的分布:由总体中全部样本平均数的可能取值和与之相应的概率组成。二、重复抽样分布注意:统计量的取值不但和样本容量有关,而且和抽样方法有关,以下分别研究重复抽样和不重复抽样的抽样分布。样本的概率分布把某一抽样方法的全部可能的样本指标与其相应的概率排列起来,就得到样本的概率分布。若将样本指标的取值分别记为其相应的概率记为P1,P2,…Pn,将它们按顺序排列起来,可得如下概率分布表。,,...,21nxxxx1x2xnx……nP)(xP……nP1P2P学生ABCDEFG成绩30405060708090按随机原则抽选出4名学生,并计算平均分数。平均数的抽样分布01230405060708090样本均值样本均值样本均值ABCDABCEABCFABCGABDEABDFABDGABEFABEGABFGACDEACDF4547.55052.55052.5555557.56052.555ACDGACEFACEGACFGADEFADEGADFGAEFGBCDEBCDFBCDG
本文标题:第五章 抽样推断
链接地址:https://www.777doc.com/doc-419975 .html