您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 03定性变量的统计描述.
第三章:定性变量的统计描述引子:定性变量定量变量研究方法统计描述统计推断变量卫生统计学统计学两分类多分类【举例】某年甲乙两地发生麻疹流行,甲地发病人数为300人,乙地发病人数为250人,甲地发病人数比乙地多50人,能否据此认为甲地麻疹发病比乙地严重呢?.目的:比较甲、乙两地麻疹的发病情况。问题1.甲地麻疹发病比乙地严重吗?问题2.该怎样表示两地麻疹发病强度?绝对数相对数分类资料的统计描述常用相对数往往先统计具有某种属性的个体数,进而用相对数来描述和比较这类变量。相对数(Relativenumber)的概念:是两个具有内在联系的指标之比。包括频率(FrequencyorProportion)强度(Intensity)相对比(Relativeratio)第一节定性变量频率分布定性资料频率分布表/图特点:能描述一个全面的分布特征,即把所有各种可能性的特征都给描述出来。相对数指标特点:从某个侧面来描述定性变量,尽管不一定能全面的描写某分布,但有助于统计描述和推断。相对数指标频率分布表/图分布特征频率型指标强度型指标相对比指标一、多分类变量的频率分布表3-1某课题组为了解城乡居民慢性病的患病情况,于2010年对某地区城乡25个社区的居民进行了调查。课题组对资料进行了整理,将1381例被访者和284例慢性病患者按职业分组制成频数表见表3-1表3-12010年某地区被访者和慢性病患者按职业分组的频率分布图3-12010年某地区调查的被访者和慢性病患者的职业分布53.451.425.213.112.78.310.9250%20%40%60%80%100%被访者患者农民事业职员企业工人商业人员图3-22010年某地区慢性病患者的职业分布农民51%事业职员25%企业工人13%商业人员11%二、二分类变量的频率分布患慢性病的频率占:284/181=20.6%不患病的频率占:1-20.6%=79.4%(2)所以对这样一个二项分类来说,用一个20.6%就能描述整个资料的频率分布。表3-22010年某地区1381例被访者是否慢性病患者的频率分布二分类资料,对1381名被访者中,农民患病的频率占19.8%,不患病的占80.2%。表3-32010年某地区1381例被访者按职业分组的慢性病患病率051015202530农民事业职员企业工人商业人员图3-32010年某地区1381例被访者不同职业的慢性病的患病率(%)患病率(%)表3-42010年某地区1381例被访者按职业和性别分组的慢性病患病率0102030农民事业职员企业工人商业人员患病率(%)男性女性图3-4某地区1381例被访者按职业和性别分组的慢性病患病率(%)第二节常用相对数指标一、频率型指标(Frequency)指某现象发生的频率,或表示事物内部某个组成成分所占的比重或分布。k单位总数可能发生某现象的观察数发生某现象的观察单位频率频率的特征:分子是分母的一部分;无量纲,在0~1之间取值。计算公式:麻疹患者300人甲地30000人二、强度(intensity)强度是流行病学、统计学术语,指单位时间内某现象发生的频率。K时间单位数可能发生某事件的观察数某事件发生的观察单位强度分母含有时间,指单位时间内的频率;其统计学本质为频率强度,即概率强度的近似值。计算公式:特点:“人时”:人×观察时间(年、月)举例:10个人观察1年单位“人年”10人年1个人观察10年有3个人,第1个人观察10年第2个人观察5年第3个人观察1年16人年相当于16个人观察了1年∴观察人时的总和=单位时间×折合的观察人数1个人观察1年1人年K某事件发生的观察单位数强度可能发生某事件的观察单位数时间K某事件发生的观察单位数折合的可能发生某事件的观察单位数单位时间≈单位时间内新发生的概率式中的K为比例基数,可以为100%、1000‰、10000/万、100000/10万等。例3-2某企业2003年有2839名职工,该企业每年都对职工进行体检,这一年新发生高血压病人5例,试求2003年的高血压发病率:答:即:2003年的高血压发病率为1.76人/1000人年。据此推测2003年观察人群发生高血压的概率是1.76‰。1000/1000HBP观察时间可能发生高血压的人数新发生高血压人数人年发病率人年人年人人1000/76.11000/1000128395【举例】:在某医院院内感染调查中,5031个病人共观察了127859人日(人均25.4日,也相当于127859人各观察1日),其中有596人在医院发生感染,试求其院内感染率?100%×127859人×1日596人院内感染率K观察人数总和新发病例数×0.47人/100人日答:即每天医院内发生院内感染的频率是0.47人/100人日,据此推测平均每天100人中有0.47个患者将在医院内发生感染。三、相对比(relativeratio)是两个有关联的指标A与B,实际应用中简称比(ratio),说明二者的对比水平。%100BA相对比计算公式:意义:表示相对于B的一个单位,A有多少个单位,或A为B的若干倍或百分之几。1.A和B是绝对数,也可是相对数、平均数。2.A和B可是同性质的指标,也可是不同性质的指标,即其量纲可以相同,也可以不同。3.但A和B应互不包含。人口调查中使用的男女性别比例比。某病年龄组发病率之比。甲乙两地亩产量之比医院管理中“医护人员与病床数”之比注意:【举例】【举例】某市1977~1979年肺癌死亡率城区为19.39/10万,郊区为9.99/10万,比较二者的严重程度。答:即城区肺癌死亡率为郊区的1.94倍。R=19.39/9.99=1.94四、应用相对数时应注意的问题:(一)不可望文生义不少指标命名混乱,某某率满天飞!有的某某率实际上只是相对比!更多的指标笼统的称为“率”,但分不清究竟是频率,还是强度。故实践中遇到相对比的指标,应认真思考其定义,辩别其性质,切不可顾名思义。(二)频率型指标的解释要紧扣总体与属性表3-12010年某地区被访者和慢性病患者按职业分组的频率分布表3-22010年某地区1381例被访者是否慢性病患者的频率分布表3-32010年某地区1381例被访者按职业分组的慢性病患病率(三)计算相对数的分母应有足够数量。例一:甲医院治疗100例患者,其中40例有效。甲医院有效率是40%例二:乙医院治疗5例患者,其中2例有效。乙医院有效是2/5,其疗效有待于进步观察故资料总例数过少,则计算所得相对数的偏差会比较大,这种情况下直接报告原始数据更为可取。(四)正确的合并估计频率举例:甲医院治疗患者100例,40例有效。乙医院治疗同类患者90例,30例有效,计算两院的总有效率。答:分别计算甲、乙两院的有效率,相加后除2:就分别将分子(分母)相加作为合并估计的分子(分母)有效率=21100409030(+)正确合并:100+9040+30有效率==36.8%(五)相对数间的比较要具有可比性观察对象、研究方法(检验手段、抽样方法)、观察时间等;观察对象的内部构成;非同期资料对比时应注意客观条件的变化注意以下几个方面:(六)对样本相对数的统计推断:统计学研究特点:抽样研究:研究的是样本,目的对总体作出推断得到的是频率,要对概率作出推断。从样本估计总体相对数,需进行参数估计和假设检验对频率分布进行统计推断比较成熟对强度指标进行统计推断不容易对相对比进行统计推断非常困难理论和技术第三节医学人口统计常用指标•医学人口统计:是从卫生保健的角度研究和描述人口数量、分布、结构、变动及其规律,研究人口与卫生事业发展的关系,是卫生统计学的重要组成部分。一、医学人口统计资料的来源(一)人口普查资料人口普查(census)是收集、整理和分析一个国家或一定地区在某一特定时间的人口、经济和社会资料的全过程,人口普查提供了最基本的人口数据和社会经济方面的资料(二)人口抽样调查资料人口抽样调查则相对省力,可以多次进行,也可以一次调查较多的项目根据样本所具有的数量特征还可推论总体的相应特征。(三)人口登记资料人口登记是指人口事件发生后随即进行登记。生命事件登记简称生命登记,联合国将其定义为:生命事件登记是对生命事件(包括出生、死亡等)的法定登记,记录和报告生命事件的发生,收集、整理和分析生命事件的有关资料人口迁移变动登记是对所发生的人口迁出或迁入事件进行记录,包括迁入或迁出的时间、地点、原因及个人的基本情况等。户口登记是按人或按户建立每个人一生(从出生到死亡)中一切人口事件的记录,包括姓名、性别等基本情况,此外还设有因出生、死亡、迁移及常住人口婚姻状况变动、分居、合居、失踪、寻回、收养、认领等引起户口变动方面的登记。二、描述人口学特征的常用指标(一)人口总数人口总数:(populationsize)一般指一个国家或地区在某一特定时间的人口数。按惯例,一般采用一年的中点,即7月1日零时为标准时刻来进行统计当人口数在一年中是均匀变动时,可用相邻两年年末(12月31日)人口数的平均值计算年平均人口数;也可用年中(7月1日零时)人口数代表全年的平均人口数。(二)人口学特征指标人口学的基本特征包括年龄、性别、文化、职业等,其中最常用来描述人口构成情况的是性别和年龄。老年(人口)系数指老年人口在总人口中所占比重,是说明人口年老程度的指标,可作为划分人口类型的尺度一般把65岁及以上的人口称为老年人口。少年儿童(人口)系数指14岁及以下少年儿童在总人口中所占比重。负担系数(dependencyratio):又称抚养比或抚养系数,是指人口中非劳动年龄人数与劳动年龄人数之比。老少比:指65岁及以上的老年人口与14岁及以下的少年儿童人口之比,表示每100名少年儿童对应多少老年人,是划分人口类型的标准之一。性别比(sexratio):指男性人口与女性人口的比值表3-5人口学特征指标指标分子分母基数指标类型老年(人口)系数≥65岁人口数人口总数100%频率型少儿(人口)系数≤14岁人口数人口总数100%频率型总负担系数≤14岁人口数+≥65岁人口数15~64岁人口数100%相对比型少儿负担系数老年负担系数老少比性别比≤14岁人口数≥65岁人口数≥65岁人口数男性人口数15~64岁人口数15~64岁人口数≤14岁人口数女性人口数100%100%100%100%相对比型相对比型相对比型相对比型三、有关生育的常用统计指标有关生育的常用统计指标生育与计划生育统计资料的来源公安、卫生、民政和计划生育等部门★反映生育水平的统计指标粗出生率(crudebirthrate,CBR)指某地某年的活产率总生育率(generalfertilityrate,GFR)指某地某年平均每千名育龄妇女的活产数•年龄组生育率(age-specificfertilityrate,ASFR)又称年龄别生育率,消除了育龄妇女内部年龄构成不同对生育水平的影响;•终生生育率(life-timefertilityrate,LTFR)★测量人口再生育的统计指标自然增长率(naturalincreaserate,NIR)是粗出生率(CBR)与粗死亡率(CDR)之差,即NIR=CBR-CDR。•粗再生育率(grossreproductionrate,GRR)是只计算女婴的总和生育率。•净再生育率(netreproductionrate,NRR)确切能替代母亲一代执行生育职能的比例表3-6生育与计划生育统计指标指标分子分母基数指标类型粗出生率同年活产数同年平均人口数×1年1000‰强度型(近似)总生育率同年活产数同年15~49岁妇女数1000‰相对比型年龄组生育率同年某年龄组活产数同年某年龄组平均妇女数×1年1000‰强度型(近似)终生生育率同批妇女所生子女数经历育龄期的同批妇女数1000‰相对比型避孕现用率同期接受避孕措施人数同期15~49岁妇女数1000‰相对比型计划生育率同年符合计划生育的活产数同年活产总数100%频率型人工流产率年内人工流产次数同年15~49岁妇女数100%
本文标题:03定性变量的统计描述.
链接地址:https://www.777doc.com/doc-3050207 .html