1、连续型资料连续型资料资资 料料离散型资料离散型资料小样本小样本大样本大样本多个样本多个样本方差分析1/80第五五章2 2检验2/80二、二、2检验与连续型资料假设检验区分检验与连续型资料假设检验区分一、一、2检验定义检验定义三、三、2检验用途检验用途3/802 检验检验(Chi-square test)对样本对样本频数分布频数分布所来自总体分布是否服从某所来自总体分布是否服从某种理论分布或某种假设分布所作假设检验,即依种理论分布或某种假设分布所作假设检验,即依据样本频数分布来推断总体分布。据样本频数分布来推断总体分布。一、一、2检验定义检验定义4/80二、二、2检验与连续型资料假设检验区分检验
2、与连续型资料假设检验区分对总体参数或几个总体对总体参数或几个总体参数之差参数之差不是对总体参数检验,不是对总体参数检验,而是对总体分布假设而是对总体分布假设检验检验正态分布正态分布总体分布是未知总体分布是未知连续连续型型资料资料离散型资料离散型资料检验对象检验对象总体总体数据资料数据资料连续型资料假设检验连续型资料假设检验2 2 检验检验5/80三、三、2检验用途检验用途适合性检验适合性检验独立性检验独立性检验同质性检验同质性检验6/80适合性检验(吻合度检验)适合性检验(吻合度检验)是指对样本理论数先经过一定理论分布推是指对样本理论数先经过一定理论分布推算出来,然后用算出来,然后用实际观察值
3、实际观察值实际观察值实际观察值与与理论数理论数理论数理论数相比较,相比较,从而得出实际观察值与理论数之间是否吻合。从而得出实际观察值与理论数之间是否吻合。所以又叫吻合度检验。所以又叫吻合度检验。7/80是指研究是指研究两个或两个以上两个或两个以上两个或两个以上两个或两个以上计数资料或属性计数资料或属性资料资料之间是相互独立或者是相互联络假设检验,之间是相互独立或者是相互联络假设检验,经过假设所观察各属性之间没相关联,然后证经过假设所观察各属性之间没相关联,然后证实这种无关联假设是否成立。实这种无关联假设是否成立。独立性检验独立性检验8/80在连续型资料假设检验中,对在连续型资料假设检验中,对一
4、个一个一个一个样本样本方方方方差差差差同质性检验,也需进行同质性检验,也需进行2 2 检验。检验。同质性检验同质性检验9/80第一节:2检验原理与方法2检验基本原理2检验统计量基本形式2值特点2检验基本步骤2检验注意事项10/802 2检验检验就是统计样本就是统计样本实际观察值实际观察值实际观察值实际观察值与与理论推算理论推算理论推算理论推算值值值值之间偏离程度。之间偏离程度。实际观察值与理论推算值之间偏离程度就决定实际观察值与理论推算值之间偏离程度就决定其其2 2值大小。理论值与实际值之间偏差越大,值大小。理论值与实际值之间偏差越大,2 2值就越大,越不符合;偏差越小,值就越大,越不符合;偏
5、差越小,2 2值就越小,值就越小,越趋于符合;若两值完全相等时,越趋于符合;若两值完全相等时,2 2值就为值就为0 0,表明理论值完全符合。表明理论值完全符合。原理原理11/80理论值理论值观察值观察值12/802检验统计量基本形式检验统计量基本形式2(OiEi)2 EiO实际观察频数实际观察频数(observational frequency)E无效假设下期望频数无效假设下期望频数(expectation frequency)13/80性别性别观察值(观察值(O)理论值理论值(E)O-E公公母母428448438438-10+10l累计8768760876只羔羊性别调察只羔羊性别调察抽样误差
6、?抽样误差?实质性变化?实质性变化?14/80 要回答这个问题,首先需要确定一个统计量,要回答这个问题,首先需要确定一个统计量,将其用来表示将其用来表示实际观察值实际观察值实际观察值实际观察值与与理论值理论值理论值理论值偏离程度;然偏离程度;然后判断这一偏离程度是否属于抽样误差,即进行后判断这一偏离程度是否属于抽样误差,即进行显著性检验。显著性检验。判断实际观察值与理论值偏离程度,最简单判断实际观察值与理论值偏离程度,最简单方法是求出实际观察值与理论值方法是求出实际观察值与理论值差数差数差数差数。15/80性别性别观察值(观察值(O)理论值理论值(E)O-E公公母母428448438438-1
7、0+10l累计876876羔羊性别观察值与理论值羔羊性别观察值与理论值 因为差数之和正负相消,并不能反应实因为差数之和正负相消,并不能反应实际观察值与理论值相差大小。际观察值与理论值相差大小。016/80为了防止正、负相抵消问题,可将实际观为了防止正、负相抵消问题,可将实际观察值与理论值差数平方后再相加,也就是计算:察值与理论值差数平方后再相加,也就是计算:(O OE E)2 2O实际观察频数实际观察频数E无效假设下期望频数无效假设下期望频数17/80羔羊性别观察值与理论值羔羊性别观察值与理论值性别性别l观察值(O)理论值理论值(E)O-E(OE)2 公公母母428448438438-10+1
8、0100100l累计876876018/80 值越大,观察值与理论值相差也就值越大,观察值与理论值相差也就越大,反之越小。越大,反之越小。19/80200200元元0 0元元奖学金奖学金一等一等三等三等10元元10元元实际得到实际得到190190元元实际得到实际得到6060元元谁的贡献大?5 5141420/80这两组观测值与理论值的偏离程度是不相同的这两组观测值与理论值的偏离程度是不相同的两组差数即使相同,但其差数占理论值两组差数即使相同,但其差数占理论值比重比重不一样。不一样。等级等级l观察值(O)理论理论(E)O-E(OE)2一等一等三等三等1906020070-10-101001002
9、1/80 为了填补这一不足,可先将实际观察值与理为了填补这一不足,可先将实际观察值与理论值差数论值差数平方平方平方平方,即(,即(O OE E)2 2,再用差数平方除以,再用差数平方除以对应理论值,将之化为相对数,从而来反应(对应理论值,将之化为相对数,从而来反应(O OE E)2 2 比重,最终将各组求和,这个总和就是比重,最终将各组求和,这个总和就是2 2 。22/80羔羊性别观察值与理论值羔羊性别观察值与理论值性别性别l观察值(O)理论值理论值(E)O-E(OE)2/E公公母母428448438438-10+100.22830.2283l累计87687600.45662(OiEi)2 E
10、i2值就等于各组观察值就等于各组观察值和理论值差平方与理论值和理论值差平方与理论值之比,再求其和。值之比,再求其和。23/802值特点值特点2(OiEi)2 Ei24/802 2值与概率值与概率P P成反比,成反比,2 2值越小,值越小,P P值越大,说值越大,说明实际值与理论值之差越小,样本分布与假设理论分明实际值与理论值之差越小,样本分布与假设理论分布越相一致布越相一致;2 2越大,越大,P P值越小,说明二者之差越大,样本值越小,说明二者之差越大,样本分布与假设理论分布越不一致。分布与假设理论分布越不一致。25/80观察值与理论值差异由抽样误差引发,即观观察值与理论值差异由抽样误差引发,
11、即观察值理论值。同时给出相反备择假设察值理论值。同时给出相反备择假设H HA A :观察:观察值与理论值差值不等于值与理论值差值不等于0 0,即观察值,即观察值理论值理论值普通确定为普通确定为0.050.05或或0.010.011.1.提出无效假设提出无效假设H H0 0基本步骤2.2.确定显著水平确定显著水平26/803.3.计算样本计算样本2 2值值4.4.进行统计推断进行统计推断2 2 P 2 2 2 2P P 2 2P P P 2 2 2 249/80给药方式给药方式有效有效无效无效总数总数有效率有效率口服口服注射注射585864644040313198(98(R R1 1)95(95
12、(R R2 2)59.259.267.467.4总数总数122(122(C C1 1)71(71(C C2 2)193(193(T T)给药方式与给药效果给药方式与给药效果2222列联表列联表1.H1.H0 0 :给药方式与给药效果相互独立。:给药方式与给药效果相互独立。H HA A :给药方式与给药效果相关联。:给药方式与给药效果相关联。2.2.给出显著水平给出显著水平0.050.0550/803.3.依据依据H H0 0,利用概率乘法法则:事件,利用概率乘法法则:事件A A与事件与事件B B同时同时出现概率为:出现概率为:P(AB)=P(A)P(B)P(AB)=P(A)P(B)口服与有效同
13、时出现理论频率口服频率口服与有效同时出现理论频率口服频率有效有效频率,即频率,即P(AB)=P(A)P(B)P(AB)=P(A)P(B)98/193 122/19398/193 122/193理论频数理论频数EiEi理论频率理论频率总数总数(98/193 122/193)193(98/193 122/193)193(98 12298 122)/193=61.95/193=61.95即即E EijijR Ri iCCj j/T=/T=行总数行总数列总数列总数/总数总数51/80E E1111=R=R1 1 C C1 1/T=61.95 E/T=61.95 E1212=R=R1 1 C C2 2/
14、T=36.05/T=36.05E E2121=R=R2 2 C C1 1/T=60.05 E/T=60.05 E2222=R=R2 2 C C2 2/T=34.95/T=34.95给药方式给药方式有效有效无效无效总数总数口服口服注射注射58(58(61.9561.95)64(64(60.0560.05)40(40(36.0536.05)31(31(34.9534.95)98(98(R R1 1)95(95(R R2 2)总数总数122(122(C C1 1)71(71(C C2 2)193(193(T T)给药方式与给药效果给药方式与给药效果2222列联表列联表52/80计算计算2 2值值:因
15、为:因为df=(r-1)(c-1)=(2-1)(2-1)=1df=(r-1)(c-1)=(2-1)(2-1)=1,故所计算,故所计算2 2值需进行连续性矫正:值需进行连续性矫正:给药方式给药方式有效有效无效无效总数总数口服口服注射注射58(58(61.9561.95)64(64(60.0560.05)40(40(36.0536.05)31(31(34.9534.95)98(98(R R1 1)95(95(R R2 2)总数总数122(122(C C1 1)71(71(C C2 2)193(193(T T)53/804.4.查查2 2表,当表,当df=1df=1时,时,2 20.050.05 3
16、.8413.841,而,而2 2c c=0.863=0.863 2 20.050.05 ,P P0.050.05,应接收,应接收H H0 0 ,拒绝,拒绝H HA A ,说明给药方式与给药效果相互独,说明给药方式与给药效果相互独立立.54/802 22 2列联列联表表2 2检验可利用以下简式而无须计算理论次检验可利用以下简式而无须计算理论次数:数:T/2T/2为矫正数为矫正数55/80给药方式给药方式有效有效无效无效总数总数口服口服注射注射585864644040313198(98(R R1 1)95(95(R R2 2)总数总数122(122(C C1 1)71(71(C C2 2)193(
17、193(T T)56/80 行行 列列 1 12 2C Cl累计1 12 2O O1111O O2121O O1212O O2222O O1c1cO O2c2cR R1 1R R2 2l累计C C1 1C C2 2C Cc cT T2c2c列联表普通形式列联表普通形式因为因为df=(2-1)(c-1)2df=(2-1)(c-1)2,故计算值时不需作连续性矫正,故计算值时不需作连续性矫正57/80检测甲、乙、丙三种农药对烟蚜毒杀效果,结果以检测甲、乙、丙三种农药对烟蚜毒杀效果,结果以下,使分析这三种农药对烟蚜毒杀效果是否一致?下,使分析这三种农药对烟蚜毒杀效果是否一致?甲甲乙乙丙丙l累计死亡数死
18、亡数未死亡数未死亡数3737150150494910010023235757109109307307l累计1871871491498080416416三种农药毒杀烟蚜死亡情况三种农药毒杀烟蚜死亡情况例子例子58/801.1.H H0 0 :对烟蚜毒杀效果与农药无关,农药类型间:对烟蚜毒杀效果与农药无关,农药类型间相互独立;相互独立;H HA A :二者相关:二者相关2.2.取显著水平取显著水平0.050.053.3.统计数计算统计数计算59/8060/80理论值计算:理论值计算:甲甲乙乙丙丙l累计死亡数死亡数未死亡数未死亡数3737(49.00)(49.00)150150(138.00(138
19、.00)4949(39.04)(39.04)100100(109.96(109.96)2323(20.96)(20.96)5757(59.04)(59.04)109109307307l累计18718714914980804164162 2值计算:值计算:61/80(4 4)查)查2 2值表,进行推断值表,进行推断查查2 2表,当表,当df=(2-1)(3-1)=2df=(2-1)(3-1)=2时,时,2 20.05 0.05 5.995.99,现实得,现实得2 27.6947.6942 20.05 0.05,则拒绝,则拒绝H H0 0 ,接,接收收H HA A ,说明三种农药对烟蚜毒杀效果不一
20、致。,说明三种农药对烟蚜毒杀效果不一致。62/80简便计算公式简便计算公式甲甲乙乙丙丙l累计死亡数死亡数未死亡数未死亡数3737(49.00)(49.00)150150(138.00(138.00)4949(39.04)(39.04)100100(109.96(109.96)2323(20.96)(20.96)5757(59.04)(59.04)109109307307l累计187187149149808041641663/8064/80(三)(三)rcrc列联表独立性检验列联表独立性检验 行行 列列 1 12 2C Cl累计1 12 2r rO O1111O O2121O Or1r1O O1
21、212O O2222O Or2r2O O1c1cO O2c2cO OrcrcR R1 1R R2 2R Rc cl累计C C1 1C C2 2C Cc cT T rc列联表是指列联表是指r3、c 3计数资料,上表是计数资料,上表是rc列联表普通形式。列联表普通形式。df=(r-1)(c-1)1,故不需进行连,故不需进行连续性矫正。续性矫正。65/80rcrc列联表计算公式:列联表计算公式:i=1,2,r j=1,2,c66/80例例某医院用碘及治疗地方性甲状腺肿,不某医院用碘及治疗地方性甲状腺肿,不一样年纪治疗效果列于下表,试检验不一样一样年纪治疗效果列于下表,试检验不一样年纪治疗效果有没有差
22、异?年纪治疗效果有没有差异?l年纪(岁)治愈治愈显效显效好转好转无效无效l累计11113030313150505050以上以上6767323210109 9232311111010202023235 54 45 5919179794949l累计109109434353531414219219不一样年纪用碘剂治疗甲状腺肿效果比不一样年纪用碘剂治疗甲状腺肿效果比较较67/801.H0:治疗效果与年纪无关;:治疗效果与年纪无关;HA:治疗效果与:治疗效果与年纪相关,即不一样年纪治疗效果不一样;年纪相关,即不一样年纪治疗效果不一样;2.给出显著水平给出显著水平0.010.0168/803.3.计算统计
23、数计算统计数2:l年纪(岁)治愈治愈显效显效好转好转无效无效l累计11113030313150505050以上以上6767323210109 9232311111010202023235 54 45 5919179794949l累计10910943435353141421921969/804.查查2表,当表,当df=(3-1)(4-1)6时,时,20.0116.81,所以,所以246.98820.01,P0.01,应拒,应拒绝绝H0,接收,接收HA,说明治疗效果与年纪相关。,说明治疗效果与年纪相关。70/80 在治疗效果与年纪相关基础上,能够将下面在治疗效果与年纪相关基础上,能够将下面34列联
24、表做成列联表做成3个24列联表,测验列联表,测验2个年纪段疗效差异:个年纪段疗效差异:11113030岁岁与与31315050岁岁两个年纪段疗效比较两个年纪段疗效比较11113030岁岁与与5050岁以上岁以上两个年纪段疗效比较两个年纪段疗效比较31315050岁岁与与5050岁以上岁以上两个年纪段疗效比较两个年纪段疗效比较71/80(1)(1)11113030岁岁与与31315050岁岁两个年纪段疗效比较两个年纪段疗效比较l年纪(岁)治愈治愈显效显效 好转好转 无效无效l累计1111303031315050676732329 92323101020205 54 491917979l累计999
25、9323230309 917017072/80(2)(2)11113030岁岁与与5050岁以上岁以上两个年纪段疗效比较两个年纪段疗效比较l年纪(岁)治愈治愈显效显效 好转好转 无效无效l累计111130305050以上以上676710109 91111101023235 55 591914949l累计777720203333101014014073/80(3)(3)31315050岁岁与与5050岁岁以上两个年纪段疗效比较以上两个年纪段疗效比较l年纪(岁)治愈治愈显效显效 好转好转 无效无效l累计313150505050以上以上3232101023231111202023234 45 579
26、794949l累计4242343443439 912812874/8011113030岁与岁与31315050岁两个年纪段疗效比较岁两个年纪段疗效比较 2 2 21.20221.202(极显著极显著)11113030岁与岁与5050岁以上两个年纪段疗效比较岁以上两个年纪段疗效比较2 2 38.3738.37(极显著极显著)31315050岁与岁与5050岁以上两个年纪段疗效比较岁以上两个年纪段疗效比较2 2 9.5749.574(显著显著)df=(2-1)(4-1)=3 df=(2-1)(4-1)=3 2 20.050.05=7.81 =7.81 2 20.010.01=11.34=11.34
27、 75/80小结小结适合性检验适合性检验2检验检验独立性检验独立性检验多组资料多组资料显隐性显隐性两组资料两组资料22列联表列联表2c列联表列联表rc列联表列联表76/80多组资料多组资料显隐性显隐性两组资料两组资料r:m77/8022列联表列联表2c列联表列联表rc列联表列联表78/80 习题习题1.1.进行大豆等位酶进行大豆等位酶AphAph电泳分析,电泳分析,193193份份野生大豆、野生大豆、223223份栽培大豆等位基因型次数列份栽培大豆等位基因型次数列于下表,试分析大豆于下表,试分析大豆AphAph等位酶等位基因频率等位酶等位基因频率是否因物种而不一样。是否因物种而不一样。物种等位基因 总计123野生大豆29(23.66)68(123.87)96(45.47)193栽培大豆22(27.34)199(143.13)2(52.53)223总计512679841679/80l习题2.下表为不一样浇灌方式下水稻叶片衰老情况调查资料。试测验稻叶衰老情况是否与浇灌方式相关。l浇灌方式绿叶数黄叶数枯叶数总计深水146(140.69)7(8.78)7(10.53)160浅水183(180.26)8(11.24)13(13.49)205湿润152(160.04)14(9.98)16(11.98)182总计481303654780/80