(06)第6章假设检验(2011年).ppt

资源描述

1、数据分析(方法与案例)作者贾俊平统计学统计学6 - 2统计学STATISTICS(第四版) 正如一个法庭宣告某一判决为“无罪(not guilty)”而不为“清白(innocent)”，统计检验的结论也应为“不拒绝”而不为“接受”。 Jan Kmenta统计名言统计名言第 6 章假设检验6.1 假设检验的基本原理 6.2 一个总体参数的检验6.3 两个总体参数的检验6 - 4统计学STATISTICS(第四版)学习目标l假设检验的基本思想和原理 l假设检验的步骤l一个总体参数的检验l两个总体参数的检验lP值的计算与应用l用Excel进行检验6 - 5统计学STATISTICS(第四版)

2、正常人的平均体温是37oC吗？当问起健康的成年人体温是多少时，多数人的回答是37oC，这似乎已经成了一种共识。下面是一个研究人员测量的50个健康成年人的体温数据 37.136.936.937.136.436.936.636.236.736.937.636.737.336.936.436.137.136.636.536.737.136.236.337.536.937.036.736.937.037.136.637.236.436.637.336.137.137.036.636.936.737.236.337.136.736.837.037.036.137.06 - 6统计学STATISTICS

3、(第四版)正常人的平均体温是37oC吗？根据样本数据计算的平均值是36.8oC ，标准差为0.36oC 根据参数估计方法得到的健康成年人平均体温的95%的置信区间为(36.7，36.9)。研究人员发现这个区间内并没有包括37oC 因此提出“不应该再把37oC作为正常人体温的一个有任何特定意义的概念” 我们应该放弃“正常人的平均体温是37oC”这个共识吗？本章的内容就将提供一套标准统计程序来检验这样的观点6.1 6.1 假设检验的基本原理假设检验的基本原理 6.1.1 6.1.1 怎样提出假设？怎样提出假设？ 6.1.2 6.1.2 怎样做出决策？怎样做出决策？ 6.1.3 6.1.3 怎样表

4、述决策结果？怎样表述决策结果？第 6 章假设检验6.1.1 怎样提出假设？6.1 6.1 假设检验的基本原理假设检验的基本原理6 - 9统计学STATISTICS(第四版)什么是假设?(hypothesis)在参数检验中，对总体参数的具体数值所作的陈述n就一个总体而言，总体参数包括总体均值、比例、方差等n分析之前必需陈述我认为这种新药的疗效我认为这种新药的疗效比原有的药物更有效比原有的药物更有效! !6 - 10统计学STATISTICS(第四版)什么是假设检验? (hypothesis test) 先对总体的参数(或分布形式)提出某种假设，然后利用样本信息判断假设是否成立的统计方法有参数

5、检验和非参数检验逻辑上运用反证法，统计上依据小概率原理n小概率是在一次试验中，一个几乎不可能发生的事件发生的概率n在一次试验中小概率事件一旦发生，我们就有理由拒绝原假设6 - 11统计学STATISTICS(第四版)原假设(null hypothesis) 又称“0假设”，研究者想收集证据予以反对的假设，用H0表示所表达的含义总是指参数没有变化或变量之间没有关系最初被假设是成立的，之后根据样本数据确定是否有足够的证据拒绝它总是有符号 , 或nH0 ： = 某一数值nH0 ：某一数值nH0 ：某一数值l例如, H0 ： 10cm6 - 12统计学STATISTICS(第四版) 也称“

6、研究假设”,研究者想收集证据予以支持的假设，用H1或Ha表示所表达的含义是总体参数发生了变化或变量之间有某种关系备择假设通常用于表达研究者自己倾向于支持的看法，然后就是想办法收集证据拒绝原假设，以支持备择假设总是有符号 , 或 nH1 ：某一数值nH1 ：某一数值nH1 ： ”或“”的假设检验，称为单侧检验或单尾检验(one-tailed test)n备择假设的方向为“”，称为右侧检验双侧检验与单侧检验双侧检验与单侧检验6 - 14统计学STATISTICS(第四版)双侧检验与单侧检验 (假设的形式)假双左右原假H0 : m =m0H0 : m m0H0 : m m0 假H1 :

7、m m0H1 : m m0以总体均值的检验为例以总体均值的检验为例6 - 15统计学STATISTICS(第四版)【例6-1】一种零件的生产标准是直径应为10cm，为对生产过程进行控制，质量监测人员定期对一台加工机床检查，确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm，则表明生产过程不正常，必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设提出假设提出假设( (例题分析例题分析) )解：解：研究者想收集证据予以证明的假设应该是研究者想收集证据予以证明的假设应该是“生产过程不正常生产过程不正常”。建立的原假设和备择假。建立的原假设和备择假设为设为 H H

8、0 0 ： 10cm 10cm H H1 1 ： 10cm10cm 6 - 16统计学STATISTICS(第四版)【例6-2】某品牌洗涤剂在它的产品说明书中声称：平均净含量不少于500克。从消费者的利益出发，有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设提出假设( (例题分析例题分析) )解：解：研究者抽检的意图是倾向于证研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符实这种洗涤剂的平均净含量并不符合说明书中的陈述合说明书中的陈述。建立的原假设。建立的原假设和备择假设为和备择假设为 H H0 0 ： 500 500 H

9、 H1 1 ： 500500500g500g绿叶绿叶洗涤剂洗涤剂6 - 17统计学STATISTICS(第四版)【例6-3】一家研究机构估计，某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确，该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设提出假设( (例题分析例题分析) )解：解：研究者想收集证据予以支持的假研究者想收集证据予以支持的假设是设是“ “该城市中家庭拥有汽车的比例超该城市中家庭拥有汽车的比例超过过30%30%” ”。建立的原假设和备择假设为。建立的原假设和备择假设为 H H0 0 ： 30% 30% H H1 1 ： 30%30%6 -

10、18统计学STATISTICS(第四版) 原假设和备择假设是一个完备事件组，而且相互对立n在一项假设检验中，原假设和备择假设必有一个成立，而且只有一个成立先确定备择假设，再确定原假设等号“=”总是放在原假设上因研究目的不同，对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设提出假设( (结论与建议结论与建议) )6.1.2 怎样做出决策？6.1 6.1 假设检验的基本原理假设检验的基本原理6 - 20统计学STATISTICS(第四版)两类错误与显著性水平研究者总是希望能做出正确的决策，但由于决策是建立在样本信息的基础之上，而样本又是随机的，因而就有可能犯错误原假设和备择假

11、设不能同时成立，决策的结果要么拒绝H0，要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它，当原假设不正确时拒绝它，但实际上很难保证不犯错误第类错误(错误)n原假设为正确时拒绝原假设n第类错误的概率记为，被称为显著性水平2. 第类错误(错误)n原假设为错误时未拒绝原假设n第类错误的概率记为(Beta)6 - 21统计学STATISTICS(第四版)两类错误的控制一般来说，对于一个给定的样本，如果犯第类错误的代价比犯第类错误的代价相对较高，则将犯第类错误的概率定得低些较为合理；反之，如果犯第类错误的代价比犯第类错误的代价相对较低，则将犯第类错误的概率定得高些一般来说，发生哪一类错误的后

12、果更为严重，就应该首要控制哪类错误发生的概率。但由于犯第类错误的概率是可以由研究者控制的，因此在假设检验中，人们往往先控制第类错误的发生概率6 - 22统计学STATISTICS(第四版)显著性水平 (significant level) 事先确定的用于拒绝原假设H0时所必须的证据能够容忍的犯第类错误的最大概率(上限值)2.原假设为真时，拒绝原假设的概率n 抽样分布的拒绝域3.表示为 (alpha)n 常用的值有0.01, 0.05, 0.104.由研究者事先确定6 - 23统计学STATISTICS(第四版)依据什么做出决策？若假设为H0：=500，H1：临界值，拒绝H0n左侧检验：

13、统计量临界值，拒绝H06 - 29统计学STATISTICS(第四版)用P 值决策 (P-value) 如果原假设为真，所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告诉我们：如果原假设是正确的话，我们得到得到目前这个样本数据的可能性有多大，如果这个可能性很小，就应该拒绝原假设被称为观察到的(或实测的)显著性水平决策规则：若p值, 拒绝 H06 - 30统计学STATISTICS(第四版)双侧检验的P 值 / / 2 2 / / 2 2 Z Z拒绝拒绝H H0 0拒绝拒绝H H0 00 0临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界

14、值临界值1/2 1/2 P P 值值1/2 1/2 P P 值值6 - 31统计学STATISTICS(第四版)左侧检验的P 值Z Z拒绝拒绝H H0 00 0临界值临界值计算出的样本统计量计算出的样本统计量P P 值值6 - 32统计学STATISTICS(第四版)右侧检验的P 值Z Z拒绝拒绝H H0 00 0计算出的样本统计量计算出的样本统计量临界值临界值P P 值值6 - 33统计学STATISTICS(第四版)P P值是关于数据的概率值是关于数据的概率 P值原假设的对或错的概率无关它反映的是在某个总体的许多样本中某一类数据出现的经常程度，它是当原假设正确时，得到目前这个样本数据的概

15、率n比如，要检验全校学生的平均生活费支出是否等于500元，检验的假设为H0：=500；H0：500 。假定抽出一个样本算出的样本均值600元，得到的值为P=0.02，这个0.02是指如果平均生活费支出真的是500元的话，那么，从该总体中抽出一个均值为600的样本的概率仅为0.02。如果你认为这个概率太小了，就可以拒绝原假设，因为如果原假设正确的话，几乎不可能抓到这样的一个样本，既然抓到了，就表明这样的样本不在少数，所以原假设是不对的值越小，你拒绝原假设的理由就越充分6 - 34统计学STATISTICS(第四版) 要证明原假设不正确，P值要多小，才能令人信服呢？n原假设的可信度又多高？如果H

16、0所代表的假设是人们多年来一直相信的，就需要很强的证据(小的P值)才能说服他们n拒绝的结论是什么？如果拒绝H0而肯定H1 ，你就需要有很强的证据显示要支持H1。比如，H1代表要花很多钱把产品包装改换成另一种包装，你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本)多大的多大的P P 值合适值合适? ?6 - 35统计学STATISTICS(第四版) 有了P值，我们并不需要用5%或1%这类传统的显著性水平。P值提供了更多的信息，它让我们可以选择任意水平来评估结果是否具有统计上的显著性，从而可根据我们的需要来决定是否要拒绝原假设n只要你认为这么大的P值就算是显著了，你就可以在

17、这样的P值水平上拒绝原假设传统的显著性水平，如1%、5%、10%等等，已经被人们普遍接受为“拒绝原假设足够证据”的标准，我们大概可以说：10%代表有“一些证据”不利于原假设；5%代表有“适度证据”不利于原假设；1%代表有“很强证据”不利于原假设固定显著性水平是否有意义固定显著性水平是否有意义6 - 36统计学STATISTICS(第四版) 用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平，以此为标准进行决策，无法知道实际的显著性水平究竟是多少n比如，根据统计量进行检验时，只要统计量的值落在拒绝域，我们拒绝原假设得出的结论都是一样的，即结果显著。但实际上，

18、统计量落在拒绝域不同的地方，实际的显著性是不同的。比如，统计量落在临界值附近与落在远离临界值的地方，实际的显著性就有较大差异。而P值给出的是实际算出的显著水平，它告诉我们实际的显著性水平是多少P P 值决策与统计量的比较值决策与统计量的比较6 - 37统计学STATISTICS(第四版)拒绝拒绝H H0 0P 值决策与统计量的比较拒绝拒绝H H0 0的两个统计量的不同显著性的两个统计量的不同显著性Z Z拒绝拒绝H H0 00 0统计量统计量1 1 P P1 1 值值统计量统计量2 2 P P2 2 值值拒绝拒绝H H0 0临界值临界值6.1.3 怎样表述决策结果？6.1 6.1 假设检验的基本

19、原理假设检验的基本原理6 - 39统计学STATISTICS(第四版)假设检验不能证明原假设正确假设检验的目的主要是收集证据拒绝原假设，而支持你所倾向的备择假设假设检验只提供不利于原假设的证据。因此，当拒绝原假设时，表明样本提供的证据证明它是错误的，当没有拒绝原假设时，我们也没法证明它是正确的，因为假设检验的程序没有提供它正确的证据n这与法庭上对被告的定罪类似：先假定被告是无罪的，直到你有足够的证据证明他是有罪的，否则法庭就不能认定被告有罪。当证据不足时，法庭的裁决是“被告无罪”，但这里也没有证明被告就是清白的6 - 40统计学STATISTICS(第四版)假设检验不能证明原假设正确假设

20、检验得出的结论都是根据原假设进行阐述的n我们要么拒绝原假设，要么不拒绝原假设当不能拒绝原假设时，我们也从来不说“接受原假设”，因为没有证明原假设是真的n采用“接受”原假设的说法，则意味着你证明了原假设是正确的没有足够的证据拒绝原假设并不等于你已经“证明”了原假设是真的，它仅仅意为着目前还没有足够的证据拒绝原假设，只表示手头上这个样本提供的证据还不足以拒绝原假设n比如，在例6.2中，如果拒绝原假设，表明样本提供的证据证明该品牌洗涤剂的净含量与说明书所标识的不相符。如果不拒绝原假设，只能说这个样本提供的证据还不足证明净含量不是500克或500克以上，并不等于证明了净含量就超过了500克 “不拒

21、绝”的表述方式实际上意味着没有得出明确的结论6 - 41统计学STATISTICS(第四版)假设检验不能证明原假设正确 “接受”的说法有时会产生误导n这种说法似乎暗示着原假设已经被证明是正确的了n实事上，H0的真实值我们永远也无法知道，不知道真实值是什么，又怎么能证明它是什么？nH0只是对总体真实值的一个假定值，由样本提供的信息也就自然无法证明它是否正确采用“不拒绝”的表述方法更合理一些，因为这种表述意味着样本提供的证据不够强大，因而没有足够的理由拒绝，这不等于已经证明原假设正确 6 - 42统计学STATISTICS(第四版)假设检验不能证明原假设正确【例】比如原假设为H0:=10，从该总

22、体中抽出一个随机样本，得到x=9.8，在=0.05的水平上，样本提供的证据没有推翻这一假设，我们说“接受”原假设，这意为着样本提供的证据已经证明=10是正确的。如果我们将原假设改为H0:=10.5，同样，在=0.05的水平上，样本提供的证据也没有推翻这一假设，我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢？6 - 43统计学STATISTICS(第四版)假设检验不能证明原假设正确假设检验中通常是先确定显著性水平，这就等于控制了第类错误的概率，但犯第类错误的概率却是不确定的在拒绝H0时，犯第类错误的概率不超过给定的显著性水平，当样本结果显示没有充分理由拒绝原假设时，也难以确切

23、知道第类错误发生的概率采用“不拒绝”而不采用“接受”的表述方式，在多数场合下便避免了错误发生的风险n因为“接受”所得结论可靠性将由第类错误的概率来测量，而的控制又相对复杂，有时甚至根本无法知道的值，除非你能确切给出，否则就不宜表述成“接受”原假设6 - 44统计学STATISTICS(第四版)假设检验不能证明原假设正确在实际检验中，针对一个具体的问题，将检验结果表述为“不拒绝”原假设，这似乎让人感到无所是从n比如，你想购买一批产品，检验的结果没有拒绝原假设，即达到合同规定的标准要求，你是否购买这批产品呢？这时，你可以对检验的结果采取某种默认态度，退一步说，你可以将检验结果表述为“可以接受

24、”原假设，你但这并不等于说你“确实接受”它6 - 45统计学STATISTICS(第四版)统计上显著不一定有实际意义当拒绝原假设时，我们称样本结果是统计上显著的(statistically Significant) 当不拒绝原假设时，我们称样本结果是统计上不显著的在“显著”和“不显著”之间没有清除的界限，只是在P值越来越小时，我们就有越来越强的证据，检验的结果也就越来越显著6 - 46统计学STATISTICS(第四版) “显著的”(Significant)一词的意义在这里并不是“重要的”，而是指“非偶然的”一项检验在统计上是“显著的”，意思是指：这样的(样本)结果不是偶然得到的，或者说，

25、不是靠机遇能够得到的如果得到这样的样本概率(P)很小，则拒绝原假设n在这么小的概率下竟然得到了这样的一个样本，表明这样的样本经常出现，所以，样本结果是显著的统计上显著不一定有实际意义6 - 47统计学STATISTICS(第四版)统计上显著不一定有实际意义在进行决策时，我们只能说P值越小，拒绝原假设的证据就越强，检验的结果也就越显著但P值很小而拒绝原假设时，并不一定意味着检验的结果就有实际意义n因为假设检验中所说的“显著”仅仅是“统计意义上的显著”n一个在统计上显著的结论在实际中却不见得就很重要，也不意味着就有实际意义因为值与样本的大小密切相关，样本量越大，检验统计量的P值也就越大，P值

26、就越小，就越有可能拒绝原假设6 - 48统计学STATISTICS(第四版)统计上显著不一定有实际意义如果你主观上要想拒绝原假设那就一定能拒绝它n这类似于我们通常所说的“欲加之罪，何患无词”n只要你无限制扩大样本量，几乎总能拒绝原假设当样本量很大时，解释假设检验的结果需要小心n在大样本情况下，总能把与假设值的任何细微差别都能查出来，即使这种差别几乎没有任何实际意义在实际检验中，不要刻意追求“统计上的”显著性，也不要把统计上的显著性与实际意义上的显著性混同起来n一个在统计上显著的结论在实际中却不见得很重要，也不意为着就有实际意义6.2 6.2 一个总体参数的检验一个总体参数的检验 6.2.

27、1 6.2.1 总体均值的检验总体均值的检验 6.2.2 6.2.2 总体比例的检验总体比例的检验 6.2.3 6.2.3 总体方差的检验总体方差的检验第 6 章假设检验6.2.1 总体均值的检验 (大样本)6.2 6.2 一个总体参数的检验一个总体参数的检验6 - 51统计学STATISTICS(第四版)总体均值的检验 (大样本)1.假定条件n大样本(n30) 使用z检验统计量n 2 已知：n 2 未知：6 - 52统计学STATISTICS(第四版)总体均值的检验( 2 已知)(例题分析大样本)【例6-4】一种罐装饮料采用自动生产线生产，每罐的容量是255ml，标准差为5ml。为检验每罐

28、容量是否符合要求，质检人员在某天生产的饮料中随机抽取了40罐进行检验，测得每罐平均容量为255.8ml。取显著性水平=0.05 ，检验该天生产的饮料容量是否符合标准要求？双侧检验双侧检验绿色绿色健康饮品健康饮品绿色绿色健康饮品2552552552556 - 53统计学STATISTICS(第四版)总体均值的检验( 2 已知)(例题分析大样本)H0 ： = 255H1 ： 255 = 0.05n = 40临界值(c):检验统计量检验统计量: :决策决策: :结论结论: : 用用ExcelExcel中的中的【NORMSDISTNORMSDIST】函数得到的双尾检验函数得到的双尾检验P=0.3129

29、45P=0.312945不拒绝不拒绝H H0 0没有证据表明该天生产的饮料没有证据表明该天生产的饮料不符合标准要求不符合标准要求 z01.96-1.960.025拒绝 H0拒绝 H00.0256 - 54统计学STATISTICS(第四版)总体均值的检验(z检验) (P 值的计算与应用)第1步：进入Excel表格界面，直接点击【fx】第2步：在函数分类中点击【统计】，并在函数名菜单下选择【NORMSDIST】，然后【确定】第3步：将 z 的绝对值1.01录入，得到的函数值为 0.843752345 P值=2(1-0.843752345)=0.312495 P值远远大于，故不拒绝H06 - 5

30、5统计学STATISTICS(第四版)总体均值的检验( 2 未知) (例题分析大样本)【例6-5】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低，从某天生产的零件中随机抽取50个进行检验。利用这些样本数据，检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低？ (=0.01) 左侧检验左侧检验50个零件尺寸的差数据 (mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.02

31、1.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.866 - 56统计学STATISTICS(第四版)总体均值的检验(例题分析大样本)H0 ： 1.35H1 ： 1.35 = 0.01n = 50临界值(c):检验统计量检验统计量: : 拒绝拒绝H H0 0新机床加工的零件尺寸的平均误新机床加工的零件尺寸的平均误差与旧机床相比有显著降低差与旧机床相比有显著降低决策决策: :结论结论: :-2.33z0拒

32、绝H00.016 - 57统计学STATISTICS(第四版)总体均值的检验 (P 值的计算与应用大样本)第1步：进入Excel表格界面，直接点击【fx】第2步：在函数分类中点击【统计】，并在函数名的菜单下选择【ZTEST】，然后【确定】第3步：在所出现的对话框【Array】框中，输入原始数据所在区域；在【X】后输入参数的某一假定值(这里为 1.35)；在【Sigma】后输入已知的总体标准差(若总体标准差未知则可忽略不填，系统将自动使用样本标准差代替) 第4步：用1减去得到的函数值0.995421023 即为P值 P值=1-0.995421023=0.004579 P值5200 =

33、0.05n = 36临界值(c):检验统计量检验统计量: : 拒绝拒绝H H0 0 ( (P P = = 0.000088 0.000088 = 0.05) = 0.05)改良后的新品种产量有显著提高改良后的新品种产量有显著提高决策决策: :结论结论: :z0拒绝H00.051.6456 - 61统计学STATISTICS(第四版)总体均值的检验(z检验) (P 值的图示)抽样分布抽样分布P P = = 0.0000880.000088 0 01.6451.645 = =0.050.05拒绝拒绝H H0 01 - 1 - 计算出的样本统计量计算出的样本统计量=3.75=3.75P P 值值6

34、 - 62统计学STATISTICS(第四版)总体均值的检验 (小样本)1.假定条件n总体服从正态分布n小样本(n =0.05，故不拒绝H0 6 - 66统计学STATISTICS(第四版)总体均值的检验 (用SPSS进行检验小样本t检验)第1步：选择【Analyze】下拉菜单，并选择【Compare MeansOne- Samples T Test】选项，进入主对话框第2步：将检验变量(零件长度)选入【Test Variable(s)】；在【Test Value】框内输入假设值(本题为12)第3步：点击【Options】，选择所需的置信水平(隐含值为95%)。点击【Continue】回到主对

35、话框。点击【OK】用用SPSSSPSS进行检验进行检验6 - 67统计学STATISTICS(第四版)总体均值的检验 (用SPSS进行检验小样本t检验)不拒绝不拒绝H H0 0。没有证据表明该供货商提供的零件不符。没有证据表明该供货商提供的零件不符合要求合要求 6 - 68统计学STATISTICS(第四版)一个总体均值的检验(作出判断) 是否已知小小样本量n大大是否已知否否 t 检验否否z 检验是是z 检验是是z 检验6.2.2 总体比例的检验6.2 6.2 一个总体参数的检验一个总体参数的检验6 - 70统计学STATISTICS(第四版)总体比例检验假定条件n总体服从二项分布n可用

36、正态分布来近似(大样本) 检验的 z 统计量 0 0为假设的总体比例为假设的总体比例6 - 71统计学STATISTICS(第四版)总体比例的检验 (例题分析)【例6-8】一种以休闲和娱乐为主题的杂志，声称其读者群中有80%为女性。为验证这一说法是否属实，某研究部门抽取了由200人组成的一个随机样本，发现有146个女性经常阅读该杂志。分别取显著性水平 =0.05和=0.01 ，检验该杂志读者群中女性的比例是否为80%？它们的P值各是多少？双侧检验双侧检验6 - 72统计学STATISTICS(第四版)总体比例的检验 (例题分析)H0 ： = 80%H1 ： 80% = 0.05n = 200临

37、界值(c):检验统计量检验统计量: :拒绝拒绝H H0 0 ( (P P = = 0.013328 0.013328 0.013328 = = 0.01)0.01)没有证据表明没有证据表明“该杂志声称读者群该杂志声称读者群中有中有80%80%为女性为女性”的看法不正确的看法不正确决策决策: :结论结论: :z02.58-2.580.005拒绝 H0拒绝 H00.0056.2.3 总体方差的检验6.2 6.2 一个总体参数的检验一个总体参数的检验6 - 75统计学STATISTICS(第四版)总体方差的检验 ( 2检验) 检验一个总体的方差或标准差假设总体近似服从正态分布使用 2分布检验

38、统计量假设的总体方差假设的总体方差6 - 76统计学STATISTICS(第四版)总体方差的检验(例题分析)【例6-9】啤酒生产企业采用自动生产线灌装啤酒，每瓶的装填量为640ml，但由于受某些不可控因素的影响，每瓶的装填量会有差异。此时，不仅每瓶的平均装填量很重要，装填量的方差同样很重要。如果方差很大，会出现装填量太多或太少的情况，这样要么生产企业不划算，要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过4ml。企业质检部门抽取了10瓶啤酒进行检验，得到的样本标准差为s=3.8ml。试以0.05的显著性水平检验装填量的标准差是否符合要求？朝日朝日BEER朝日朝日BEER朝日朝日BE

39、ER朝日朝日6 - 77统计学STATISTICS(第四版)总体方差的检验(例题分析)H0 ： 2 42H1 ： 2 42 = 0.10df = 10 - 1 = 9临界值(s):统计量统计量: :不拒绝不拒绝H H0 0 (p=0.52185)(p=0.52185)没有证据表明没有证据表明装填量的标准差不装填量的标准差不符合要求符合要求 20 016.9190 =0.05决策决策: :结论结论: :6.3 6.3 两个总体参数的检验两个总体参数的检验 6.3.1 6.3.1 两个总体均值之差的检验两个总体均值之差的检验 6.3.2 6.3.2 两个总体比例之差的检验两个总体比例之差的检验 6

40、.3.3 6.3.3 两个总体方差比的检验两个总体方差比的检验第 6 章假设检验6.3.1 两个总体均值之差的检验6.3 6.3 两个总体参数的检验两个总体参数的检验6 - 80统计学STATISTICS(第四版)两个总体均值之差的检验 (独立大样本)1.假定条件n两个样本是独立的随机样本n正态总体或非正态总体大样本(n130和 n230) 检验统计量n 12 ， 2 已知：n 12 ， 2 未知：6 - 81统计学STATISTICS(第四版)两个总体均值之差的检验 (例题分析独立大样本)【例例6-106-10】某公司对男女职某公司对男女职员的平均小时工资进行了调员的平均小时工资进行了调查

41、，独立抽取了具有同类工查，独立抽取了具有同类工作经验的男女职员的两个随作经验的男女职员的两个随机样本，并记录下两个样本机样本，并记录下两个样本的均值、方差等资料如右表的均值、方差等资料如右表。在显著性水平为。在显著性水平为0.050.05的条的条件下，能否认为男性职员与件下，能否认为男性职员与女性职员的平均小时工资存女性职员的平均小时工资存在显著差异？在显著差异？两个本的有关数据男性女性n1=44n1=32x1=75x2=70S12=64 S22=42.256 - 82统计学STATISTICS(第四版)两个总体均值之差的检验 (例题分析独立大样本)H0 ：1- 2 = 0H1 ：1- 2

42、 0 = 0.05n1 = 44，n2 = 32临界值(c):检验统计量检验统计量: :决策决策: :结论结论: : 拒绝拒绝H H0 0该公司男女职员的平均小时工该公司男女职员的平均小时工资之间存在显著差异资之间存在显著差异 z01.96-1.960.025拒绝 H0拒绝 H00.0256 - 83统计学STATISTICS(第四版)两个总体均值之差的检验 (独立小样本： 12， 22 已知) 假定条件n两个独立的小样本n两个总体都是正态分布n 12， 22已知检验统计量6 - 84统计学STATISTICS(第四版)两个总体均值之差的检验 (独立小样本：12，22 未知但12=22)1.

43、1.假定假定条件条件n n两个独立的小样本两个独立的小样本n n两个两个总体都是正态分布总体都是正态分布n n 1 12 2、 2 22 2未知但相等，即未知但相等，即 1 12 2= = 2 22 22.2.检验检验统计量统计量其中：其中：自由度：自由度：6 - 85统计学STATISTICS(第四版)两个总体均值之差的检验 (独立小样本：12，22 未知且不等1222) 假定条件n两个总体都是正态分布n12，22未知且不相等，即1222n样本量不相等，即n1n2 检验统计量自由度：自由度：6 - 86统计学STATISTICS(第四版)两个总体均值之差的检验 (例题分析独立小样本，12=2

44、2) 【例例6-116-11】甲、乙两台机床同时加工某种同类型的零甲、乙两台机床同时加工某种同类型的零件，已知两台机床加工的零件直径件，已知两台机床加工的零件直径( (单位：单位：cm)cm)分别服分别服从正态分布，并且有从正态分布，并且有 1 12 2= = 2 22 2 。为比较两台机床的加工。为比较两台机床的加工精度有无显著差异，分别独立抽取了甲机床加工的精度有无显著差异，分别独立抽取了甲机床加工的8 8个个零件和乙机床加工的零件和乙机床加工的7 7个零件，通过测量得到如下数据个零件，通过测量得到如下数据。在。在=0.05=0.05的显著性水平下，样本数据是否提供证据的显著性水平下，样

45、本数据是否提供证据支持支持 “ “两台机床加工的零件直径不一致两台机床加工的零件直径不一致” ”的看法？的看法？两台机床加工零件的本数据 (cm)甲20.519.819.720.420.120.019.019.9乙20.719.819.520.820.419.620.26 - 87统计学STATISTICS(第四版)两个总体均值之差的检验 (例题分析12=22)H0 ：1- 2 = 0H1 ：1- 2 0 = 0.05n1 = 8，n2 = 7临界值(c):检验统计量检验统计量: :决策决策: :结论结论: : 不拒绝不拒绝H H0 0没有证据表明没有证据表明两台机床加工的零两台机床加工的零件

46、直径不一致件直径不一致t02.160-2.1600.025拒绝 H0拒绝 H00.0256 - 88统计学STATISTICS(第四版)两个总体均值之差的检验 (用Excel进行检验)第1步：将原始数据输入到Excel工作表格中第2步：选择【工具】下拉菜单并选择【数据分析】选项第3步：在【数据分析】对话框中选择【t-检验：双样本等方差假设】第4步：当对话框出现后在【变量1的区域】方框中输入第1个样本的数据区域在【变量2的区域】方框中输入第2个样本的数据区域在【假设平均差】方框中输入假定的总体均值之差在【】方框中输入给定的显著性水平(本例为0.05) 在【输出选项】选择计算结果的

47、输出位置，然后【确定】进行检验进行检验6 - 89统计学STATISTICS(第四版)两个总体均值之差的检验 (用Excel进行检验)Excel的输出结果6 - 90统计学STATISTICS(第四版)两个总体均值之差的检验 (例题分析独立小样本，1222) 【例例6-126-12】甲、乙两台机床同时加工某种同类型的零甲、乙两台机床同时加工某种同类型的零件，已知两台机床加工的零件直径件，已知两台机床加工的零件直径( (单位：单位：cm)cm)分别服分别服从正态分布，并且有从正态分布，并且有 1 12 2 2 22 2 。为比较两台机床的加工。为比较两台机床的加工精度有无显著差异，分别独立抽取

48、了甲机床加工的精度有无显著差异，分别独立抽取了甲机床加工的8 8个个零件和乙机床加工的零件和乙机床加工的7 7个零件，通过测量得到如下数据个零件，通过测量得到如下数据。在。在=0.05=0.05的显著性水平下，样本数据是否提供证据的显著性水平下，样本数据是否提供证据支持支持 “ “两台机床加工的零件直径不一致两台机床加工的零件直径不一致” ”的看法？的看法？两台机床加工零件的本数据 (cm)甲20.519.819.720.420.120.019.019.9乙20.719.819.520.820.419.620.26 - 91统计学STATISTICS(第四版)两个总体均值之差的检验 (用Ex

49、cel进行检验)第1步：将原始数据输入到Excel工作表格中第2步：选择“工具”下拉菜单并选择【数据分析】选项第3步：在【数据分析】对话框中选择【t-检验：双样本异方差假设】第4步：当对话框出现后在【变量1的区域】方框中输入第1个样本的数据区域在【变量2的区域】方框中输入第2个样本的数据区域在【假设平均差】方框中输入假定的总体均值之差在【】方框中输入给定的显著性水平(本例为0.05) 在【输出选项】选择计算结果的输出位置，然后【确定】进行检验进行检验6 - 92统计学STATISTICS(第四版)两个总体均值之差的检验 (用Excel进行检验)Excel的输出结果6 - 93

50、统计学STATISTICS(第四版)用SPSS进行检验(独立小样本，12=22 ；1222) 在用SPSS中进行检验时，需要把两个样本的观测值作为一个变量输入(本例为“零件尺寸”)，然后设计另一个变量用于标记每个观测值所属的样本(本例为“机床”，1表示机床1，2表示机床2)第1步：选择【Analyze】【Compare MeansIndependent-Samples T Test 】进入主对话框第2步：检验变量(零件尺寸)选入【Test Variable(s)】, 将分组变量(机床)选入【Grouping Variable(s)】，并选择【Define Groups】，在【Group1后输入

展开阅读全文