您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 医学试题/课件 > 复旦版工程数学之概率统计课件第24讲
前面我们介绍了随机变量的数学期望和方差,对于多维随机变量,反映分量之间关系的数字特征中,最重要的,就是本讲要讨论的协方差和相关系数任意两个随机变量X和Y的协方差,记为Cov(X,Y),定义为⑶Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)⑴Cov(X,Y)=Cov(Y,X)一、协方差2.简单性质⑵Cov(aX,bY)=abCov(X,Y)a,b是常数Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}1.定义Cov(X,Y)=E(XY)-E(X)E(Y)可见,若X与Y独立,Cov(X,Y)=0.3.计算协方差的一个简单公式由协方差的定义及期望的性质,可得Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)=E(XY)-E(X)E(Y)即若X1,X2,…,Xn两两独立,,上式化为D(X+Y)=D(X)+D(Y)+2Cov(X,Y)4.随机变量和的方差与协方差的关系),(2)()(11jininijiiiXXCovXDXDniniiiXDXD11)()(协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受X与Y本身度量单位的影响.例如:Cov(kX,kY)=k2Cov(X,Y)为了克服这一缺点,对协方差进行标准化,这就引入了相关系数.二、相关系数为随机变量X和Y的相关系数.定义:设D(X)0,D(Y)0,)()(),(YDXDYXCovXY称在不致引起混淆时,记为.XY相关系数的性质:11||.证:由方差的性质和协方差的定义知,对任意实数b,有0≤D(Y-bX)=b2D(X)+D(Y)-2bCov(X,Y))(),(XDYXCovb令,则上式为D(Y-bX)=)()],([)(2XDYXCovYD])()()],([1)[(2YDXDYXCovYD]1)[(2YD由于方差D(Y)是正的,故必有1-≥0,所以||≤1。22.X和Y独立时,=0,但其逆不真.由于当X和Y独立时,Cov(X,Y)=0.故)()(),(YDXDYXCov=00但由并不一定能推出X和Y独立.请看下例.例1设X服从(-1/2,1/2)内的均匀分布,而Y=cosX,(请课下自行验证)因而=0,即X和Y不相关.但Y与X有严格的函数关系,即X和Y不独立.不难求得,Cov(X,Y)=0,1.3存在常数a,b(b≠0),使P{Y=a+bX}=1,(详细证明自看,见教材.)即X和Y以概率1线性相关.考虑以X的线性函数a+bX来近似表示Y,以均方误差e=E{[Y-(a+bX)]2}来衡量以a+bX近似表示Y的好坏程度,e值越小表示a+bX与Y的近似程度越好.用微积分中求极值的方法,求出使e达到最小时的a,b.相关系数刻划了X和Y间“线性相关”的程度.=E(Y2)+b2E(X2)+a2-2bE(XY)+2abE(X)-2aE(Y)e=E{[Y-(a+bX)]2}0)(2)(2)(20)(2)(222XaEXYEXbEbeYEXbEaae)(),(0XDYXCovb解得)()(00XEbYEa这样求出的最佳逼近为L(X)=a0+b0X这样求出的最佳逼近为L(X)=a0+b0X这一逼近的剩余是若=0,Y与X无线性关系;Y与X有严格线性关系;,1若可见,若0||1,||的值越接近于1,Y与X的线性相关程度越高;||的值越接近于0,Y与X的线性相关程度越弱.E[(Y-L(X))2]=D(Y)(1-)2请看演示相关系数的直观意义稍事休息但对下述情形,独立与不相关等价若(X,Y)服从二维正态分布,则X与Y独立X与Y不相关前面,我们已经看到:若X与Y独立,则X与Y不相关,但由X与Y不相关,不一定能推出X与Y独立.矩、协方差矩阵在数学期望一讲中,我们已经介绍了矩和中心矩的概念.这里再给出混合矩、混合中心矩的概念.协方差Cov(X,Y)是X和Y的二阶混合中心矩.称它为X和Y的k+L阶混合(原点)矩.若})]([)]({[LkYEYXEXE存在,称它为X和Y的k+L阶混合中心矩.)(LkYXE设X和Y是随机变量,若k,L=1,2,…存在,可见,协方差矩阵的定义将二维随机变量(X1,X2)的四个二阶中心矩})]({[21111XEXEc)]}()][({[221112XEXXEXEc排成矩阵的形式:)]}()][({[112221XEXXEXEc})]({[22222XEXEc称此矩阵为(X1,X2)的协方差矩阵.22211211cccc这是一个对称矩阵类似定义n维随机变量(X1,X2,…,Xn)的协方差矩阵.下面给出n元正态分布的概率密度的定义.为(X1,X2,…,Xn)的协方差矩阵nnnnnncccccccccC212222111211称矩阵都存在,i,j=1,2,…,n),(jijiXXCovc若)]}()][({[jjiiXEXXEXE)}()(21exp{||)2(11212XCXCnf(x1,x2,…,xn)则称X服从n元正态分布.其中C是(X1,X2,…,Xn)的协方差矩阵.|C|是它的行列式,表示C的逆矩阵,1CX和是n维列向量,表示X的转置.X设=(X1,X2,…,Xn)是一个n维随机向量,若它的概率密度为Xn元正态分布的几条重要性质1.X=(X1,X2,…,Xn)服从n元正态分布a1X1+a2X2+…+anXn均服从正态分布.对一切不全为0的实数a1,a2,…,an,n元正态分布的几条重要性质2.若X=(X1,X2,…,Xn)服从n元正态分布,Y1,Y2,…,Yk是Xj(j=1,2,…,n)的线性函数,则(Y1,Y2,…,Yk)也服从多元正态分布.这一性质称为正态变量的线性变换不变性.n元正态分布的几条重要性质3.设(X1,X2,…,Xn)服从n元正态分布,则“X1,X2,…,Xn相互独立”等价于“X1,X2,…,Xn两两不相关”例2设随机变量X和Y相互独立且X~N(1,2),Y~N(0,1).试求Z=2X-Y+3的概率密度.故X和Y的联合分布为正态分布,X和Y的任意线性组合是正态分布.解:X~N(1,2),Y~N(0,1),且X与Y独立,D(Z)=4D(X)+D(Y)=8+1=9E(Z)=2E(X)-E(Y)+3=2+3=5即Z~N(E(Z),D(Z))Z~N(5,32)故Z的概率密度是,231)(18)5(2zZezfzZ~N(5,32)这一讲我们介绍了协方差和相关系数相关系数是刻划两个变量间线性相关程度的一个重要的数字特征.注意独立与不相关并不是等价的.当(X,Y)服从二维正态分布时,有X与Y独立X与Y不相关
本文标题:复旦版工程数学之概率统计课件第24讲
链接地址:https://www.777doc.com/doc-4402326 .html