您好,欢迎访问三七文档
第四节必要样本容量的确定一、确定必要样本容量(samplesize)的意义二、必要样本容量的计算公式(一)重复抽样的必要样本容量1.平均数的必要样本容量2.成数的必要样本容量222xtn22)1(ppptn例1、在某市组织职工家庭生活抽样调查,已知职工家庭平均每人每月生活费收入的标准差为11.5元,要求把握程度为0.9545,允许误差为1元,试问需要抽查多少户进行调查。例2、调查一批机械零件的合格品率,根据过去的资料,合格品率曾有过99%、97%、95%三种情况,现在要求允许误差不超过1%,要求推断的把握程度为95%,试问需要抽查多少个零件。解:已知=0.05,当p未知时保守地用最大方差0.25代替(当p=0.50时,p(1-p)的值最大)^应抽取的样本容量为385)05.0()5.01)(5.0()96.1()1(22222ppZn【例】一家市场调研公司想估计某地区有彩色电视机的家庭所占的比例。该公司希望对比例p的估计误差不超过0.05,要求的可靠程度为95%,应抽多大容量的样本(没有可利用的p估计值)。(二)不重复抽样的必要样本容量1.平均数的必要样本容量2.成数的必要样本容量22222tNNtnx)1()1(222pptNppNtnp例3、要调查某省10000名高校教师平均月工资水平,根据以往资料该省高校教师工资的方差为132.25,要求把握程度为95.45%,抽样极限误差为1元,需要抽查多少名教师。例4、某电子元件厂日产10000只元件,经多次一般测试一等品率为92%,现拟采用随机抽样方法进行抽检,如要求误差范围在2%之内,可靠程度为95.45%,试求需要抽取多少只电子元件。(三)影响必要样本容量的因素1.受标准差或方差的影响2.受允许误差的影响3.受概率度的影响4.受抽样方法的影响第五节抽样调查的组织方式(1)简单随机抽样1.从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的2.最基本的抽样方法,是其它抽样方法的基础3.特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便4.局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率1.概率抽样常见的抽样框:大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息。抽样框是指对总体单位列出名册或排序编号,以确定总体的抽样范围和结构。(2)分层抽样1.将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本2.优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计分层(类)抽样:等比例抽样2N3N1N1n2n3nNNNN321nnnn321抽取样本分层(类)抽样:不等比例抽样(3)等距抽样1.将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位2.优点:操作简便,可提高估计的精度3.缺点:对估计量方差的估计比较困难如学生按记名册号码排队,职工家计调查按平均工资排队等。按等距调查的抽样方式来抽选调查单位,能够使抽出的调查单位更均匀地分布在全及总体中,因此,它的抽样误差一般较简单随机抽样小。••••••••••••••••••••【例】N=20n=4样间Nkn=20抽隔54按等距调查的抽样方式来抽选调查单位,能够使抽出的调查单位更均匀地分布在全及总体中,因此,它的抽样误差一般较简单随机抽样小。(二)抽样的方法等距抽样排队时,按照所依据的标志不同有两种方法:1.无关标志排队法无关标志排队法:对总体单位按照与调查内容无直接关系的标志进行排列。【例1】一个学校有3000名学生,抽取120名进行调查,可利用学生名册进行排列,从1号排到3000号,抽选间隔是3000/120=25人。先从第一组25人中随机确定第一被抽选人,假定是15号,然后每隔25人抽选1人,则第二间隔中抽第15+25(40)号,第三组中抽第40+25(65)号……当第一个单位的位置确定之后,其余各单位的位置也就确定了。【例2】进行工业产品质量检查,确定按5%的比率抽取时,可按连续生产的时间顺序每20个产品抽取1个(100个抽5个),一直抽到预定的样本单位数为至。这里时间和产品质量没有十分密切的关系。2.按有关标志排队法有关标志排队法:对总体单位按照与调查内容有直接关系的标志排队。【例】调查职工生活水平情况时,按照工资排队;农产量调查,按照总体单位的上年亩产量进行排队等。按照有关标志排队,考虑到样本的代表性,一般是从第一间隔内容中居中的单位开始抽取。(4)整群抽样1.将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查2.特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差群整群抽样总体样本样本由抽取的“群”组成,抽样误差由“群”与“群”之间的差异大小决定。“群”内进行普查。1.某企业从报告期所生产的一大批产品中随机抽选了100件产品进行耐用性能检验,测得其平均耐用时数为6000小时,标准差为400小时。要求:(1)试在95%的概率保证程度下对这一大批产品的平均耐用时数进行区间估计。(t=1.96)(2)在其他条件不变时,若抽样极限误差缩到45.27小时,则必要的样本单位数应为多少?2.某县教育部门为了解该县教师的年龄情况,随机抽取100名教师进行调查,结果发现教师平均年龄为36.8岁,标准差为8.6岁。要求:(1)以95%的置信度估计该县教师的平均年龄;(2)在其他条件不变时,若抽样极限误差为2岁,则必要的样本单位数应为多少?3.从某制药厂仓库中随机抽取100瓶进行检验,其结果平均每瓶为99片,样本标准差为3片,要求:(1)如果可靠程度为99.73%,计算该仓库平均每瓶vc的区间范围;(2)如果极限误差减少到原来的1∕2,可靠程度仍为99.73%,问需要调查多少瓶vc?(t=3)4.技术人员从某橡胶制品厂报告期生产的汽车轮胎中随机抽取了50只轮胎进行使用寿命检测,测得样本的平均寿命为45,000公里,标准差为7000公里。要求:(1)在95%的概率保证程度下对该厂报告期生产的汽车轮胎的平均使用寿命进行区间估计(t=1.96);(2)在其他条件不变时,若抽样极限误差缩小一半,必要的样本单位数应是多少?5.为了研究某新产品的适销情况,某公司在该市举办的商品交易会上,对1000名顾客进行调查,得知其中有700人喜欢这种产品。要求:(1)以95.45%的概率保证程度确定该市居民喜欢此种产品比率的区间范围;(2)如果极限误差减少为1.45%,其他条件不变,需要调查多少名顾客?(t=2)6.某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率的区间范围。7.某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样本一级品率为85%,当把握程度为90%时试推断这批产品一级品率的区间范围。若这批产品共有2000只,进一步推算出这批产品中一级品总数Np的置信区间。x=6000s=400xs400===40n100μ1.某企业从报告期所生产的一大批产品中随机抽选了100件产品进行耐用性能检验,测得其平均耐用时数为6000小时,标准差为400小时。要求:(1)试在95%的概率保证程度下对这一大批产品的平均耐用时数进行区间估计.(t=1.96)(2)在其他条件不变时,若抽样极限误差缩小到45.27小时,则必要的样本单位数应为多少?解:(1)已知n=100222222x×σt1.96400n===300Δ45.27xx=t=1.96×40=78.4μΔ又知F(z)=95%t=1.96则≤6000+78.46000-78.4≤X≤6078.4X即5921.6≤结论:我们有95%的把握使这一大批产品的平均耐用时数落在5921.6到6078.4小时之间。(2)x=36.8岁xμs8.6===0.86岁n1002.某县教育部门为了解该县教师的年龄情况,随机抽取100名教师进行调查,结果发现教师平均年龄为36.8岁,标准差为8.6岁。要求:(1)以95%的置信度估计该县教师的平均年龄(z=1.96);(2)在其他条件不变时,若抽样极限误差为2岁,则必要的样本单位数应为多少?s=8.6岁,F(z)=95%z=1.96则解:(1)已知n=100222222x×σz1.968.6n===71Δ2xx岁=Ζ=1.96×0.86=1.69(2)结论:我们以95%的置信度估计该县教师的平均年龄在35.11到38.49岁之间。X36.8-1.69≤≤36.8+1.69X即35.11≤≤38.493.从某制药厂仓库中随机抽取100瓶进行检验,其结果平均每瓶为99片,样本标准差为3片,要求:(1)如果可靠程度为99.73%,计算该仓库平均每瓶vc的区间范围;(2)如果极限误差减少到原来的1∕2,可靠程度仍为99.73%,问需要调查多少瓶vc?(Z=3)x2s9===0.3n100解:(1)已知:n=100s=3x=99Z=3xΔ=Ζμ=3×0.3=0.9222zs9×9n===400Δ0.2025X99-0.9≤≤99+0.9(2)已知:s=3Z=3△=3×0.3∕2=0.4598.1≤X≤99.9结论:我们有99.73%的把握使该仓库平均每瓶vc在98.1到99.9片之间。4.技术人员从某橡胶制品厂报告期生产的汽车轮胎中随机抽取了50只轮胎进行使用寿命检测,测得样本的平均寿命为45,000公里,标准差为7000公里。要求:(1)在95%的概率保证程度下对该厂报告期生产的汽车轮胎的平均使用寿命进行区间估计(Z=1.96);(2)在其他条件不变时,若抽样极限误差缩小一半,必要的样本单位数应是多少?F(z)=95%z=1.96则x=45000s=7000解:(1)已知n=50xx=Ζ=1.96×990.10=1940.60μΔ(只)xs7000===990.10μn50X45000-1940.6≤≤45000+1940.6(2)即43059.4≤X≤46940.6222222x×1.96σz7000n===188.24Δ1000结论:在95%的概率保证程度下,该厂报告期生产的汽车轮胎的平均使用寿命在43059.4至46940.6公里之间。5.为了研究某新产品的适销情况,某公司在该市举办的商品交易会上,对1000名顾客进行调查,得知其中有700人喜欢这种产品。要求:(1)以95.45%的概率保证程度确定该市居民喜欢此种产品比率的区间范围;(2)如果极限误差减少为1.45%,其他条件不变,需要调查多少名顾客?(z=2)(1)已知:p=700/1000=70%z=2n=1000解:pp(1-p)70%×30%μ===1.45%n1000则ppΔ=Ζμ=2×1.45%=2.9%2222pzp(1-p)2×70%×30%n===40001.45%Δ70%-2.9%≤P≤70+2.9%(2)已知:z=2△p=1.45%即67.1%≤P≤72.9%结论:我们以95.45%的概率保证程度确定该市居民喜欢此种产品比率的67.1%至72.9%之间。6.某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率的区间范围。(Z=2)ˆ380p=×100%=95%400则ˆˆ95%(1-95%)=1.09%400pP(1-P)μ==n1解:已
本文标题:第七章4节
链接地址:https://www.777doc.com/doc-3866460 .html