您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 2019-2020学年高中数学-第一章-统计案例章末复习教案-新人教A版选修1-2.doc
第一章2019-2020学年高中数学第一章统计案例章末复习教案新人教A版选修1-2一、本章知识脉络:二、本章要点追踪:1.样本点的中心(x-,y-)其中x-=1nn∑i=1xi,y-=n∑i=1yi.2.线性回归模型的完美表达式y=bx+a+eE(e)=0,D(e)=σ23.类比样本方差估计总体方差的思想,可以用σ2∧=1n-2n∑i=1e2∧i=1n-2Q(a∧,b∧)(n>2)作为σ2的估计量其中a∧=y--b∧x-统计案例回归分析样本点的中心随机误差残差分析建立回归模型的基本步骤回归分析列联表K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)判断结论成立可能性的步骤b∧=n∑i=1(xi-x-)(yi-y-)n∑i=1(xi-x-)24.我们可以用相关指数R2来刻画回归的效果,其计算公式是:R2=1-n∑i=1(yi-yi∧)2n∑i=1(yi-yi-)2R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.5.建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+x);(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等。6.作K2来确定结论“X与Y有关系”的可信程度.三、几个典型例题:例1某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下,血硒74668869917366965873发硒13101311169714510(1)画出散点图;(2)求回归方程;(3)如果某名健康儿童的血硒含量为94(1000ppm)预测他的发硒含量.解(1)散点图如下图所示:(2)利用计算器或计算机,求得回归方程:y∧=0.2358x-6.9803(3)当x=94时,y∧≈15.2因此,当儿童的血硒含量为94(1000ppm)时,该儿童的发硒含量约为15.2(1000ppm).例2某地大气中氰化物测定结果如下:污染源距离50100150200250300400500氰化物浓度0.6870.3980.2000.1210.090.050.020.01(1)试建立氰化物浓度与距离之间的回归方程.(2)求相关指数.(3)作出残差图,并求残差平方和解析(1)选取污染源距离为变量x,氰化物浓度为自因变量y作散点图.从表中所给的数据可以看出,氰化物浓度与距离有负的相关关系,用非线性回归方程来拟合,建立y关于x的指数回归方程.y∧=0.9293e-0.0094x(2)相关指数K2=1-n∑i=1(yi-yi∧)2n∑i=1(yi-y∧)2=0.9915(3)编号12345678污染源距离50100150200250300400500氰化物浓度0.6870.3980.20.1210.090.050.020.01残差0.10618570.035-0.027-0.0210.0014-0.005-0.0020.0015残差平方和n∑i=1(yi-yi∧)2=0.0118例3某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机制取了189名员工进行调查,所得数据如下表所示:积极支持企业改革不太造成企业改革合计工作积极544094工作一般326395合计86103189对于人力资源部的研究项目,根据上述数据能得出什么结论?解:根据列联表中的数据,得到K2=189×(54×63-40×32)294×95×86×103=10.76.因为10.76>6.635,所以有99%的把握说:员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.例4有人统计了同一个省的6个城市某一年的人均国内生产总值(即人均GDP)和这一年各城市患白血病的儿童数量,如下表:人均GDPx(万元)1086431患白血病的儿童数y351312207175132180(1)画出散点图;(2)求y对x的回归直线方程;(3)如果这个省的某一城市同时期年人均GDP为12万元,估计这个城市一年患白血病的儿童数目;分析:利用公式分别求出ab,的值,即可确定回归直线方程,然后再进行预测.万元人均/GDP1108643100200300人数16题图解:(1)作x与y对应的散点图,如右图所示;(2)计算得67.1286)()(,17.226,33.561yyxxyxiii33.55)(612iixx,∴25.2333.5567.1286b,25.10233.525.2317.226a,∴y对x的回归直线方程是25.10225.23xy;(3)将12x代入25.10225.23xy得38125.1021225.23y,估计这个城市一年患白血病的儿童数目约为381.评注:本题涉及的是一个和我们生活息息相关,也是一个愈来愈严峻的问题——环保问题.本题告诉了我们一个沉痛的事实:现如今,一个城市愈发达,这个城市患白血病的儿童愈多.原因在于,城市的经济发展大都以牺牲环境为代价的,经济发展造成了大面积的环境污染,空气、水源中含有的大量的有害物质是导致白血病患者增多的罪魁祸首,所以,我们一定要增强自我保护意识和环境保护意识.例5寒假中,某同学为组织一次爱心捐款,于2008年2月1日在网上给网友发了张帖子,并号召网友转发,下表是发帖后一段时间的收到帖子的人数统计:天数x1234567人数y711212466115325(1)作出散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)如果此人打算在2008年2月12日(即帖子传播时间共10天)进行募捐活动,根据上述回归模型,估计可去多少人.分析:先通过散点图,看二者是否具有线性相关关系,若不具有,可通过相关函数变换,转化为线性相关关系.解:(1)散点图略.从散点图可以看出x与y不具有线性相关关系,同时可发现样本点分布在某一个指数函数曲线mxkey的周围,其中mk、是参数;(2)对mxkey两边取对数,把指数关系变成线性关系.令yzln,则变换后的样本点分布在直线),ln(mbkaabxz的周围,这样就可以利用线性回归模型来建立x与y之间的非线性回归方程了,数据可以转化为:天数x1234567人数y1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为133.1620.0xz,∴133.1620.0xey.(3)截止到2008年2月12日,10x,此时1530133.110620.0ey(人).∴估计可去1530人.评注:现如今是网络时代,很多同学都会通过互联网发帖子,所以此类问题为同学们司空见惯.但如何预测发帖后的效果,这却是个新课题,通过本题你是否已明确.例6有人发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少.为了研究国籍和邮箱名称里是否含有数字的关系,他收集了124个邮箱名称,其中中国人的70个,外国人的54个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.(1)根据以上数据建立一个2×2的列联表;(2)他发现在这组数据中,外国人邮箱名称里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,你能帮他判断一下吗?分析:按题中数据建列联表,然后根据列联表数据求出k值,即可判定.解:(1)2×2的列联表中国人外国人总计有数字432770无数字213354总计6460124(2)假设“国籍和邮箱名称里是否含有数字无关”.由表中数据得201.660645470)21273343(1242k,因为024.5k,所以有理由认为假设“国籍和邮箱名称里是否含有数字无关”是不合理的,即有005.97的把握认为“国籍和邮箱名称里是否含有数字有关”.评注:独立性检验类似于反证法,其一般步骤为:第一步:首先假设两个分类变量几乎没有关系(几乎独立);第二步:求随机变量k的值;第三步.判断两个分类变量有关的把握(即概率)有多大.例7针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的21,男生喜欢韩剧的人数占男生人数的61,女生喜欢韩剧人数占女生人数的32.(1)若有0095的把握认为是否喜欢韩剧和性别有关,则男生至少有多少人;(2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人.分析:有0095的把握认为回答结果对错和性别有关,说明841.3k,没有充分的证据显示回答结果对错和性别有关,说明706.2k.设出男生人数,并用它分别表示各类别人数,代入2K的计算公式,建立不等式求解即可.解:设男生人数为x,依题意可得列联表如下:喜欢韩剧不喜欢韩剧总计男生6x65xx女生3x6x2x总计2xxx23(1)若有0095的把握认为回答结果的对错和性别有关,则841.3k,由841.38322)66365(2322xxxxxxxxxxK,解得24.10x,∵6,2xx为整数,∴若有0095的把握认为回答结果的对错和性别有关,则男生至少有12人;(2)没有充分的证据显示回答结果的对错和性别有关,则706.2k,由706.28322)66365(2322xxxxxxxxxxK,解得216.7x,∵6,2xx为整数,∴若没有充分的证据显示回答结果的对错和性别有关,则男生至多有6人.评注:这是一个独立性检验的创新问题,解答时要注意理解“至少”、“至多”的含义.通过上面几例,大家是否已体会到了回归分析和独立性检验思想方法的应用的广泛性和重要性.其实,这两种思想方法并不神秘,你身边有很多问题可信手拈来,用它们处理,这一点还请同学们多思考、勤尝试.
本文标题:2019-2020学年高中数学-第一章-统计案例章末复习教案-新人教A版选修1-2.doc
链接地址:https://www.777doc.com/doc-3940828 .html