收藏 分享(赏)

08 分类资料的统计推断.ppt

上传人:nanchangxurui 文档编号:9043065 上传时间:2022-10-26 格式:PPT 页数:62 大小:2.50MB
下载 相关 举报
08 分类资料的统计推断.ppt_第1页
第1页 / 共62页
08 分类资料的统计推断.ppt_第2页
第2页 / 共62页
08 分类资料的统计推断.ppt_第3页
第3页 / 共62页
08 分类资料的统计推断.ppt_第4页
第4页 / 共62页
08 分类资料的统计推断.ppt_第5页
第5页 / 共62页
亲,该文档总共62页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、分分资料的统计推断资料的统计推断南京医科大学公共卫生学院生统系南京医科大学公共卫生学院生统系 柏建岭柏建岭内容提要 率的标准误及区间估计 样本率与总体率的比较 两样本率比较的2检验 多组率或者构成比的比较 配对两分类资料的假设检验 Fisher精确概率法简要回顾统计分析统计描述统计推断参数估计假设检验均数、标准差总体均数的可信区间t检验 ANOVAExample定量资料分类资料率、比、构成比总体率的可信区间2检验率的抽样误差 由于总体中个体变异的存在,在抽样过程中产生的样本率与总体率的差异或样本率间的差异 ,称为率的抽样误差。率的标准误(SE of Rate) 率的抽样误差大小的衡量指标样本标

2、准误理论标准误总体率的区间估计 (一)l查表法 n较小,如n50,特别是p接近0或1时 用样本含量n与阳性数X查附表7例6.1 有人调查29名非吸毒妇女,出狱时有1名HIV阳性,试问HIV阳性率的95%的可信区间是多少? 本例n=29,X=1,查附表7得0.117.8,即该HIV阳性率的95%的可信区间为:0.1%17.8%。总体率的区间估计 (二) 正态近似法 n足够大,p与1-p不太小,如np5和n(1-p)5样本率p的抽样分布近似正态分布。总体率的区间估计 (二) 总体率()95%的可信区间为: 总体率()99%的可信区间为:例6.2 从某地人群中随机抽取144人,检查乙型肝炎表面抗原携

3、带状况,阳性率为9.03%,求该地人群的乙型肝炎表面抗原阳性率的95%可信区间。 95%可信限为:9.03%1.962.39% 即该地人群的乙型肝炎表面抗原阳性率的95%可信区间为:4.35%13.71%。样本率与总体率的比较目的:推断该样本所代表的未知总体率与已知的总体率是否不等。正态近似法直接计算概率法6.3 两样本率的比较 目的:推断两总体率是否不等 两样本率比较的u 检验(utest)两样本率比较的2检验(chi-squaretest)两样本率比较的2检验 读作 chi2:卡方 2检验(chi-squaretest)是现代统计学的创始人KarlPearson(1857-1936)于19

4、00年提出的一种具有广泛用途的统计方法。例 6.5某医师在用蛙王露口服液治疗贫血的临床试验中,将109名受试者随机分为两组,一组为试验组,接受蛙王露口服液的治疗,结果为有效43人,无效10人;另一组为对照组,接受复方阿胶浆的治疗,结果为有效40人,无效16人,问两组有效率有无差别?例6.5四格表(fourfoldtable)理论频数 (theoreticalfrequence)如果两个样本来自同一总体,则两组有效率相同,则用合计的有效率作为总体率估计值。在这样的假设前提下,可以计算各组理论频数(theoreticalfrequency)T。处理有效人数 无效人数合计有效率(%)试验组43105

5、381.13对照组40165671.43合计832610976.1576.15 理论频数40.36理论频数的计算理论频数12.64理论频数理论频数76.15 42.6413.36四格表的理论频数由下式求得 :式中:TRC为第R 行C 列的理论频数, nR为相应的行合计, nC为相应的列合计。 2检验的基本思想(1)通过构造A与T吻合程度的统计量来反映两样本率的差别!43 10 4016实际数A 理论数T40.3612.6442.6413.36 如果H0假设成立,则实际频数与理论频数应该比较接近。差值属于随机误差,用2统计量表示: H0成立时,实际数与理论数的差别不会很大,出现较大2值概率很小。

6、如果实际频数与理论频数相差较大,2检验统计量超出了界值,则拒绝H0。若P ,则拒绝H0;若P ,则尚无理由拒绝它。2检验的基本思想(2)第一步:建立检验假设H0:两总体有效率相等,即1=2;H1:两总体有效率不等,即12。第二步:确定检验水准 = 0.05 (双侧检验)第三步:计算检验统计量 式中: A 为实际频数(actual frequency) T 为理论频数(theoretical frequency)表6.2 表6.1资料理论频数的计算有效无效合40.3612.6453照42.6413.3656合8326109T11=5383/109=40.36;T12=5326/109=12.64

7、T21=5683/109=42.64;T22=5626/109=13.36。 衡量理论数与实际数的差别a+xb-xc-xd+x第四步:确定P 值,下结论第四步:确定P 值,下结论 由于四格表资料为双边固定形式,即假设行合计与列合计均固定,所以四格表的自由度=1自由度为1 的2分布0.00.10.20.30.40.5自由度为2 的2分布0.00.10.20.30.40.52分布0.00.10.20.30.40.5自由度为1的2分布界值0.00.10.20.30.40.53.840.05v由2界值表查得20.05,1=3.84,即理论上如果H0成立,则2有95%的可能在03.84之间,23.84的

8、可能性只有0.05,是一小概率事件。3.840.05v本例2=1.41 0.05。v按=0.05水准不拒绝H0,差别无统计学意义。故故尚不能认为两组总体有效率不相同 。基本思想概括v若H0成立,则四个格子的实际频数A与理论频数T之差异纯系抽样误差所致,故一般不会很大,2值也就不会很大;在一次随机试验中,出现大的2值的概率P 是很小的。v因此,若根据实际样本资料求得一个很小的P,且P (检验水准),根据小概率原理,就有理由怀疑H0的真实性,因而拒绝它;若P,则没有理由拒绝H0 四格表资料2检验专用公式 a b cd43 104016四格表2的检验的应用条件: n40,T5,用2; n40,但1T

9、5,用校正2。 n 40,或T1,用Fisher精确概率计算法 。多(R)个率的比较,其基本数据有R行2列,构成R2表,用以表述R个率的基本数据。R2表的2检验用于推断R个样本率各自所代表的总体率是否相等。6.4多组率或构成比的比较 多个样本率的比较的公式 【例6.8】某县防疫站观察三种药物驱钩虫的疗效,在服药后7天得粪检钩虫卵阴转率(%)如下,问三药疗效是否不同? 多个率比较的多个率比较的2 2检验检验3个率比较的 2 2检验步骤检验步骤H0: 1= 2 = 3H1: 1, 2 , 3不等或不全相等0.05。计算统计量:v = 2自由度为2的 2 2分布界值分布界值0.00.10.20.30

10、.40.55.990.05 P =0.05,所以按 =0.05水准,不拒绝H0,差别无统计学意义。结论:Fisher精确概率法检验表明,根据现有资料尚不能认为两法疗效不等(P=0.2721)。 2 2检验的应用条件检验的应用条件(1)(1)l 四格表的分析方法选择条件:n40,T5,用2;n40,但140;20b+c40用校正2。b+c20,二项分布直接计算概率。 2 2检验的应用条件检验的应用条件(2)(2)lRC表的分析方法选择条件:理论数不能小于等于1;理论数大于1小于等于5的格子数不超过总格子数的1/5。l 如果以上条件不能满足,可采用:增加样本含量删去某行或某列合理地合并部分行或列Fisher精确概率法 2 2检验的应用条件检验的应用条件(3)(3)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 传记文集 > 人物传记

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报