您好,欢迎访问三七文档
2020/1/281医学统计学•第一章概论•第二章集中趋势与离散趋势的统计描述•第三章t检验•第四章方差分析•第五章卡方检验•第六章非参数检验•第七章相关与回归2020/1/282第一章概论•第一节医学统计学的意义•第二节医学统计工作中的内容和资料类型•第三节医学统计中的基本概念2020/1/283第一节医学统计学的意义•统计分析是科研工作中的一种有力工具。它同科研的总体设计、资料采集、资料整理、资料分析直到最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。•只有正确运用统计分析方法,才不致于造成不应有的缺陷或得出错误的结论。2020/1/284第二节医学统计工作中的内容和资料类型•医学统计工作的内容•资料的类型2020/1/285医学统计工作中的内容•收集资料–收集资料就是根据研究的目的,实验设计的要求,收集准确的、完整的、充满信息的原始资料。•整理资料–整理资料就是把收集到的原始资料,有目的地进行科学加工,使资料系统化、条理化,以便进行统计分析。•分析资料–分析资料就是把经过统计整理的资料,作一系列统计描述和统计推断,阐明事物的规律性。2020/1/286资料的类型•计量资料–是对每个观察对象的观察指标用定量方法测定该项指标的数值大小所得的资料,一般用度量衡单位表示。•计数资料–是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料。•等级分组资料–在医学实践中,有些资料具有计数资料的特性,同时又兼有半定量的性质,被称为按等级分组资料。2020/1/287第三节医学统计中的基本概念•变异•总体和样本•抽样•配对设计与随机区组设计•误差•概率2020/1/288变异•医学研究的对象是有机的生命体,其机能是十分复杂的。不同的个体在相同的条件下,对外界环境因素可以发生不同的反应。这种现象称只为个体差异或称为变异。•由于医学统计研究的对象是有变异的事物,因此,用观察1~2例的结果来推论出一般规律是不恰当的。科学研究工作的主要任务就是要从表现为偶然的大量数据中,分析出其中必然性的规律。2020/1/289抽样•代表性–就是要求样本中的每一个个体必须符合总体的规定。•随机性–抽签法–机械抽样法–分层抽样–随机数字表•可靠性–指对实验的结果要有可重复性,即由科研课题的样本的结果推论总体的结论有较大的可靠性。•可比性–如果进行两个或多个样本之间的比较,那么要求每两个样本之间应具有可比性,也称为齐性对比原则。2020/1/2810配对设计与随机区组设计•完全随机设计–是将受试对象随机分配到各个处理组或对照组,或分别从不同总体中随机抽样进行研究。•配对设计–它是将受试对象按一定条件配成对子,称为配对样本,将它们随机分到两个组中,分别给以不同处理。•随机区组设计–它也称为配伍组设计,是配对设计的扩展。配对设计的每一“对子”分别随机分到两个处理中,而配伍设计中的每个“配伍组”,包含有多个受试对象,要将它们分别随机分到各处理组。2020/1/2811误差•系统误差–在收集资料过程中,由于仪器初始状态未调到零、标准试剂未经效正、医生掌握疗效标准偏高或偏低等原因,可使观察结果造成倾向性的偏大或偏小,叫做系统误差。•随机测量误差–在收集资料过程中,由于各种偶然因素的影响而造成同一对象多次测定结果的不完全一致。这种误差往往没有固定的倾向,有时高有时低,被称为随机测量误差。•抽样误差–个体之间存在变异,而抽样有时只能抽去总体中的一小部分作为样本。2020/1/2812概率•概率是描述某一事件发生的可能性大小的一个量度。用A表示某一事件,P表示该事件可能发生的概率。•在一定条件下,肯定发生的事件称为必然事件,概率为1;肯定不发生的事件称为不可能事件,概率为0;可能发生也可能不发生的事件称为随机事件或偶然事件,其概率介于0与1之间。•在统计学上,习惯将P≤0.05或P≤0.01称为小概率事件,表示该事件发生的可能性很小。•在医学研究中,常把P≤0.05作为事物差别有统计学意义,P≤0.01作为事物差别有高度统计学意义的界限.2020/1/2813第二章集中趋势与离散趋势的统计描述•第一节集中趋势的描述统计–这一部分的主要内容涉及统计图表和描述平均水平和集中趋势的统计量,目的在于有效地组织、整理和表现统计资料的信息。•第二节离散趋势的描述统计–衡量变异程度大小的指标有多种,但大体可以分为两类:一类是按间距计算,有极差和四分位数间距;另一类则按平均差距计算,有离均差平方和、均方差、标准差和变异系数等。2020/1/2814第一节集中趋势的描述统计•频率分布•平均数–算术均数–几何均数–中位数–百分位数2020/1/2815频率分布•类型–频率表–直方图•用途–作为陈述资料的形式,可以代替繁复的原始资料,便于进一步分析。–便于观察数据的分布类型。–便于发现资料中某些远离群体的特大或特小的可疑值。–当样本含量比较大时,可用各组段的频率作为概率的估计值。2020/1/2816算术均数•直接法•加权法nXnXXXXXn......321nfxnxfxfxfxfXkk......3322112020/1/2817几何均数•通用式:•直接法:•分组法:nnXXXXG...321)lg(lg)lg...lglg(lg1211nXnXXXGn)lg(lg)...(lg122111nxfnxfxfxfGkk2020/1/2818中位数•直接法•当观察例数为奇数时:•M=X(n+1)/2•当观察例数为偶数时:•M=½(Xn/2+Xn/2+1)•分组法•其中L、iM、fM、分别为所在组段的下限、组距和频数,fL为M所在组之前各组段的累积频数。MMLiffnLM)5.0(2020/1/2819百分位数•百分位数用符号Px表示,x即百分位,所谓百分位数Px是指在一组数据中找到这样一个值,全部观察值的x%小于Px,而其余(100-x)%大于Px。•其中L、ix、fx、分别为Px所在组段的下限、组距和频数,fL为Px所在组之前各组段的累积频数。xXLxiffxnLP)%.(2020/1/2820第二节离散趋势的统计描述•极差和四分位数间距•平均偏差•离均差平方•方差•标准差•变异系数2020/1/2821积差和四分位数间距•积差–也称全距,即一组观察值中最大值和最小值之差,符号为R,是变异指标中最简单的一种。•四分位数间距–将所有的观察值排序后,分成四个数目相等的段落,每个段落的观察值数目各占总例数的25%,去掉两端的25%,取中间50%观察值的数值范围即为四分位数间距。–四分位数间距用符号Q表示,它可以通过计算百分位数P75和P25之差得到,即Q=P75-P252020/1/2822平均偏差•计算各观察值偏离平均数的平均差距,为了避免正负抵消,将每个观察值与均数之差的绝对值相加,然后取平均,称作平均偏差,它可以表示为:•平均偏差是一个很直观的变异量度,但由于用了绝对值,在数学上不便于继续处理,使它在应用上受到很大限制,实际中很少使用。nXX平均偏差2020/1/2823离均差平方和•为了克服平均偏差使用绝对值不便进一步运算的缺点,可以不通过取绝对值,而是通过取平方来避免正负抵消,即使用离均差平方和,其公式为:•它描述了每个观察值相对于集中位置“均数”的分散程度。通过计算可化为下式:2)(XXnXXXX222)()(2020/1/2824方差•将离均差平方和再取平均,其结果称作均方差,简称方差。•需要注意的是,对于样本资料,在对离均差平方和取平均时分母用n-1代替n,于是有:•式中s2为样本方差,分母n-1称为自由度。1)(22nXXs2020/1/2825标准差•在统计分析中为了方便,通常将方差取平方根,还原成与原始观察值单位相同的变异量度,即标准差,计算公式如下:•也可写为:1)(2nXXs1/)(22nnXXs2020/1/2826变异系数•在两组数据的均数相差不大,单位也相同时,从标准差的大小就可以直接比较两个样本的变异程度。•当均数相差较大或单位不同的几组观察值的变异程度进行比较时,标准差就不适宜了,在这种情况下可以使用变异系数,其计算公式为:%100XSCV2020/1/2827第三章t检验•第一节假设检验的意义和步骤•第二节单个样本t检验•第三节配对样本t检验•第四节两独立样本t检验2020/1/2828第一节检验假设的意义和步骤•检验假设的基本概念–检验假设是对估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设。如果拒绝,认为该样本很可能不是来自这个总体;否则,很可能来自这个总体。•建立检验假设和确定检验水平–假设:无效假设(H0)/被择假设(H1)–检验水平:•选择检验方法和统计推断分析–选择检验方法和计算检验统计量–确定P值和作出统计推断结论2020/1/2829第二节单个样本t检验(1)•例:根据大量调查,已知健康成年男子的脉搏均数为72次/分,某医生在某山区随机调查30名健康男子,求得脉搏均数为74.2次/分,标准差为6.5次/分。能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?2020/1/2830第二节单个样本t检验(2)•建立检验假设,确定检验水平–H0:µ=µ0–H1;µµ0–∝=0.05•计算检验统计量•确定P值,做出推断结论–本例自由度v=n-1=30-1=29–查附表得t0.05(29)=2.045–今tt0.05(29),故P0.05,无统计学意义854.1305.6722.74/00nsXsXtX2020/1/2831第三节配对样本t检验(1)•将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理,称为随机配对设计。•配对设计资料主要有三种情况:–两种同质受试对象分别接受两种处理;–同一受试或同一样本的两个部分,分别接受两种不同处理;–同一受试对象处理(实验或治疗)前后的结果比较。•配对设计的检验统计量为:nsdsdsdtdddd/02020/1/2832第三节配对样本t检验(2)•例:有12名接种卡介苗的儿童,八周后用两批不同的结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的前臂,问两种结核菌素的皮肤浸润反应性有无差别?•编号标准品新制品差值dd2•112.010.02.04.00•214.510.04.520.25•315.512.53.09.00•.....•1210.59.51.01.00•合计391952020/1/2833第三节配对样本t检验(3)•建立检验假设,确定检验水平–H0:µd=0–H1;µd0–∝=0.05•计算检验统计量•确定P值,做出推断结论–自由度v=n-1=12-1=11,t0.05(11)=2.201t0.01(11)=3.106–本例tt0.01(11),P0.01,差别有统计学意义25.31239ndd4909.211212)39(1951)(222nnddsd7191.0124909.2nssdd5195.47197.025.3dsdt2020/1/2834第四节两独立样本t检验感•总体方差相等时的两独立样本t检验•总体方差不等时的两样本t’检验2020/1/2835总体方差相等时的两独立样本t检验(1)•两总体方差相等(σ12=σ22)时,可将两方差合并,估计出两者的共同方差—合并方差Sc2。•两样本t检验的检验统计量为:•其中,公式2为两样本均数之差的联合标准误,公式3为联合方差。2121XXSXXt)11(21221nnSSCXX2)()(2122222121212nnnXXnXXSc2020/1/2836总体方差相等时的两独立样本t检验(2)•例:25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗
本文标题:基础医学医学统计学
链接地址:https://www.777doc.com/doc-3361196 .html