您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 医学试题/课件 > Logistic回归模型.ppt
第8讲第2节Logistic回归模型logistic回归为概率型非线性回归模型,是研究分类观察结果(y)与一些影响因素(x)之间关系的一种多变量分析方法.一.Logistic回归模型二.回归参数的估计三.回归方程的显著性检验四.回归系数的显著性检验五.Logistic回归分析方法六.模型的评价Logisticregression研究问题可否用多元线性回归方法?1.多元线性回归方法要求Y的取值为计量的连续性随机变量。2.多元线性回归方程要求Y与X间关系为线性关系。3.多元线性回归结果不能回答“发生与否”.logistic回归方法补充多元线性回归的不足.医学研究中常碰到应变量的可能取值仅有两个(即二分类变量),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多重回归的条件什么情况下采用Logistic回归Brown(1980)在术前检查了53例前列腺癌患者,拟用年龄(AGE)、酸性磷酸酯酶(ACID)两个连续型的变量,X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤的大小与位置(STAGE)三个分类变量与手术探查结果(虚拟)变量NODES(1、0分别表示癌症的淋巴结转移与未转移)建立淋巴结转移的预报模型。实例53例接受手术的前列腺癌患者情况26例冠心病病人和28例对照者进行病例对照研究26例冠心病病人和28例对照者进行病例对照研究一、Logistic回归模型•Logistic回归的分类二分类多分类条件Logistic回归非条件Logistic回归•Logit变换也称对数单位转换ln1Logitlogistic回归模型概率预报模型)(11011011011011)](exp[11)exp(1)exp(ppXXppppppeXXXXXX模型中参数的意义011ln=1XΒ0(常数项):暴露因素Xi=0时,个体发病概率与不发病概率之比的自然对数比值。0(1|0)ln=1(0|0)PyxPyx的含义:某危险因素,暴露水平变化时,即Xi=1与Xi=0相比,发生某结果(如发病)优势比的对数值。1100100110011/(1)lnln/(1)loglog()()PPORPPitPitPxxxiP1(y=1|x=1)的概率P0(y=1|x=0)的概率010011)1/()1/(oddsoddsPPPPOReORX当只有一个自变量时,以相应的预报概率为纵轴,自变量为横轴,可绘制出一条S形曲线。回归参数的正负符号与绝对值大小,分别决定了S形曲线的形状与方向。00.20.40.60.81-2.5-1.5-0.50.51.52.53.5X预报概率Logistic回归曲线中心线反映了在其他变量固定后,X=1与x=0相比发生Y事件的对数优势比。回归系数β与ORX与Y的关联•β=0,OR=1,无关β>1,OR>1,有关,危险因素β<1,OR<1,有关,保护因子事件发生率很小,OR≈RR。相对危险度(relativerisk):RR=P1/P0多元回归模型的的概念ii011logit(p)ln=1mmXX二、模型的参数估计Logistic回归参数的估计通常采用最大似然法(maximumlikelihood,ML)。最大似然法的基本思想是先建立似然函数与对数似然函数,再通过使对数似然函数最大求解相应的参数值,所得到的估计值称为参数的最大似然估计值。参数估计的公式三、整个回归模型的假设检验似然比检验(likelihoodratiotest)•比分检验(scoretest)以未包含某个或几个变量的模型为基础,保留模型中参数的估计值,并假设新增加的参数为零,计算似然函数的一价偏导数(又称有效比分)及信息距阵,两者相乘便得比分检验的统计量S。样本量较大时,S近似服从自由度为待检验因素个数的2分布。•Wald检验(waldtest)即广义的t检验,统计量为uu服从正态分布,即为标准正态离差。Logistic回归系数的区间估计iibbu=sibiSub1)似然比检验(likelihoodratiotest)2)计分检验(scoretest)3)Wald检验上述三种方法中,似然比检验最可靠,比分检验一般与它相一致,但两者均要求较大的计算量;而Wald检验未考虑各因素间的综合作用,在因素间有共线性时结果不如其它两者可靠。四、回归参数的假设检验优势比及其可信区间标准化回归参数TheLOGISTICProcedureAnalysisofMaximumLikelihoodEstimates预报模型)9169.16443.08896.5(8181818111)9169.16443.08896.5(exp11)9169.16443.08896.5exp(1)9169.16443.08896.5exp(XXeXXXXXX五、Logistic回归分析方法基本思想同线性回归分析。从所用的方法看,有强迫法、前进法、后退法和逐步法。在这些方法中,筛选变量的过程与线性回归过程的完全一样。但其中所用的统计量不再是线性回归分析中的F统计量,而是以上介绍的参数检验方法中的三种统计量之一。为计算方便,通常向前选取变量用似然比或比分检验,而向后剔除变量常用Wald检验。六、模型的评价对所建立的回归方程做拟合优度检验。检查模型估计与实际数据的符合情况。检验统计量:1.剩余差(deviance,记为D)(16-25)2.Pearsonχ2(16-26)统计量的概率值P>0.05,认为模型拟合较好例:表16-10(讲义表16-10)剩余差(D)与Pearsonχ2拟合优度检验DevianceandPearsonGoodness-of-FitStatisticsCriterionDFValuePrChiSqDeviance13.42020.0644Pearson13.42180.0643结果的表达一般logistic回归分析报告内容:1.危险因素的回归系数及标准误、p值2.标准化的回归系数。3.危险因素对应的OR和可信区间4.Logistic回归方程3//'jjjSbb本节重点掌握内容1.Logistic回归与线性回归有什么不同?2.Logistic回归可解决哪些问题?3.自变量可以有哪些类型,应用时应如何赋值?4.Logistic回归中β的含义和方程的表达。谢谢!
本文标题:Logistic回归模型.ppt
链接地址:https://www.777doc.com/doc-5193004 .html