收藏 分享(赏)

概率论与数理统计_假设检验.ppt

上传人:清凉的夏天 文档编号:5807416 上传时间:2022-06-26 格式:PPT 页数:106 大小:3.04MB
下载 相关 举报
概率论与数理统计_假设检验.ppt_第1页
第1页 / 共106页
概率论与数理统计_假设检验.ppt_第2页
第2页 / 共106页
概率论与数理统计_假设检验.ppt_第3页
第3页 / 共106页
概率论与数理统计_假设检验.ppt_第4页
第4页 / 共106页
概率论与数理统计_假设检验.ppt_第5页
第5页 / 共106页
亲,该文档总共106页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、本科生必修课:概率论与数理统计第八章 假设检验 2/101第八章 假设检验8.1 假设检验8.2 正态总体均值的假设检验8.3 正态总体方差的假设检验8.6 分布拟合检验3/1018.1 假设检验参数估计:其目的对未知参量给出估计值及置信区间,一般情况下,参数估计是在总体形式已知的情况下,对未知参量的定量的估计问题假设检验:其目的是对总体的某未知性质根据样本给出一个定性判断,这时总体的分布的函数形式未知,或只知其形式,但参数未知的情况假设检验中,为推断总体的某些性质,首先提出某些关于总体的假设,然后根据样本对所提出的假设作出判断,是接受,还是拒绝 例如:提出总体期望服从泊松分布的假设,然后进行

2、判断 提出正态总体期望为0的假设,然后进行判断4/1018.1 假设检验假设检验的基本思想和做法l通常借助于直观分析和理论分析相结合的做法l基本原理就是人们在实际问题中经常采用的所谓小概率原理:“一个小概率事件在一次试验中几乎是不可能发生的”l假设检验的过程是要构造一个小概率事件,如果根据实际样本数据的计算,该小概率事件发生了,则拒绝原假设,否则接受原假设下面结合实例来说明假设检验的基本思想.5/1018.1 假设检验实例 某车间用一台包装机包装葡萄糖, 包得的袋装糖重是一个随机变量, 它服从正态分布.l当机器正常时, 其均值为0.5公斤, 标准差为0.015公斤.l某日开工后为检验包装机是否

3、正常, 随机地抽取它所包装的糖9袋, 称得净重为(公斤):l0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 问机器是否正常? 分析:6/101由长期实践可知, 标准差较稳定, 问题: 根据样本值判断1 提出两个对立假设2 结合合理法则,再利用已知样本作出判断是接受假设H0(拒绝假设H1), 还是拒绝假设H0(接受假设H1). 如果作出的判断是接受H0, 即认为机器工作是正常的, 否则, 认为是不正常的.8.1 假设检验7/101由于要检验的假设涉及总体均值, 故可借助于样本均值来判断.于是可以选定一个适当的正数k,8.1 假设检验这里

4、的检验统计量和分布均不含任何未知参数检验方法(即合理的法则):对于未知参数,仍然从其点估计量开始讨论,将未知参数与其点估计量进行比较若过分大,则有理由怀疑H0的正确性8/1018.1 假设检验如何选取k呢,先看以下事实: 由于作出决策的依据是一个样本,当实际上H0为真时,仍可能作出拒绝H0的决策,这种可能性是无法消除的,这是一种错误。 此即假定H0正确时的小概率事件9/1018.1 假设检验因此自然希望将犯这类错误的概率控制在一定限度之内,即给出一个较小的数(00,则称为右边检验问题类似的有时需要检验假设, H0:0,H1:0,因H0中的都比H1中的要小,当H1为真时观察值往往偏大,因此拒绝域

5、的形式为 k,k是某一正常数20/1018.1 假设检验确定k,与例1中的做法类似PH0为真时拒绝H0=拒绝H0不等号成立是因为0 注意:这里 的均值为而不是0,所以放缩成后才能用正态分布。 要控制PH0为真时拒绝H0 只需令 21/1018.1 假设检验类似的有左边检验问题的拒绝域 22/1018.1 假设检验处理参数的假设检验问题的步骤如下: 1. 根据实际问题的要求提出原假设H0和备择假设H1; 2. 给定显著性水平,以及样本容量n 3. 确定检验统计量以及拒绝域的形式l其分布应与任何未知数无关,且统计量里不含其它未知参数 l统计量的构造一般的从点估计量开始考虑 4. 按PH0为真时拒绝

6、H0求出拒绝域 5. 取样,根据样本观察值作出决策,是接受H0还是拒绝H023/101例2:某工厂生产固体燃料推进器的燃烧率服从正态分布N(, 2),40cm/s,2cm/s,现在用新方法生产了一批推进器,从中随机取n25只,测得燃烧率的样本均值为 41.25cm/s,设新方法下总体均方差没变,问这批推进器的燃烧率较以往是否有显著的提高,取显著性水平0.05解:1提出原假设H0和备择假设H1; H0:040,即假设新方法没有提高燃烧率 H1:0,即假设新方法提高了燃烧率 2给定显著性水平0.05 以及样本容量n258.1 假设检验24/1018.1 假设检验3确定检验统计量以及拒绝域的形式由例

7、1,统计量为 N(0,1),拒绝域的形式为4按PH0为真时拒绝H0求出拒绝域5取样,根据样本观察值作出决策,是接受H0还是拒绝H0 z落在拒绝域中,在显著性水平下拒绝H0,因此新方法有显著提高 25/1018.2 正态总体均值的假设检验假设检验是针对弃真这一可能犯的错误人为设定一个界限,如果在这个界限内,认为原假设成立,否则的话,由于显著性水平取得很小,表明小概率事件发生,根据实际推断原理,原假设不成立。尽管也可能犯第II类取伪的错误,这时尽管总体的性质发生了改变但没有发现,往往影响较小。正态总体均值的检验分为三种情况l单个正态总体l两个正态总体l成对数据26/1018.2 正态总体均值的假设

8、检验(一)单个总体N(, 2)均值 的检验12已知,关于 的检验(Z检验)提出的假设, 双边:H0:0,H1:0, 单边:H0:0, H1:0, H0:0, H1:2.365,因而否定H0,即认为这种轮胎的耐磨性有显著差异。46/101(2)实验数据不配对分析: 将两种轮胎的数据看作来自两个总体的样本观测值,这种方法称为不配对分析法。欲检验假设8.2 正态总体均值的假设检验我们选择统计量47/101由样本数据及n1=n2=8可得8.2 正态总体均值的假设检验对给定的 =0.05查自由度为16-2=14的t分布表得临界值t/2(16-2)=t0.025(14)=2.145 由于|t|=0.516

9、02,H0中的全部2都比H1中的要小,因此,拒绝域的形式为 s2k8.3 正态总体方差的假设检验53/101即对任意的202,上式都成立,临界点是最差的情况 即拒绝域为 类似的,左边检验问题:H0:202,H1:202,相应的拒绝域为以上检验法称为2检验法8.3 正态总体方差的假设检验54/101解例3 某厂生产的某种型号的电池, 其寿命长期以来服从方差2=5000 (小时2) 的正态分布, 现有一批这种电池, 从它生产情况来看, 寿命的波动性有所变化. 现随机的取26只电池, 测出其寿命的样本方差 s2=9200(小时2). 问根据这一数据能否推断这批电池的寿命的波动性较以往的有显著的变化?

10、8.3 正态总体方差的假设检验55/101拒绝域为: 可认为这批电池的寿命的波动性较以往的有显著的变化.8.3 正态总体方差的假设检验56/101需要检验假设:(二)两个正态总体的情况8.3 正态总体方差的假设检验57/1018.3 正态总体方差的假设检验58/1018.3 正态总体方差的假设检验检验问题的拒绝域上述检验法称为F检验法.59/101解例3 某砖厂制成两批机制红砖, 抽样检查测量砖的抗折强度(公斤), 得到结果如下:已知砖的抗折强度服从正态分布, 试检验:(1)两批红砖的抗折强度的方差是否有显著差异? (2)两批红砖的抗折强度的数学期望是否有显著差异?(1) 检验假设:8.3 正

11、态总体方差的假设检验60/101查表知拒绝域为8.3 正态总体方差的假设检验61/101(2) 检验假设:8.3 正态总体方差的假设检验62/101拒绝域为8.3 正态总体方差的假设检验63/101小结本节学习的正态总体均值的假设检验有:正态总体均值、方差的检验法见下表8.3 正态总体方差的假设检验64/101 432 165/1017658.3 正态总体方差的假设检验66/101 43218.3 正态总体方差的假设检验67/1015678.3 正态总体方差的假设检验68/101t分布表a =0.250.100.050.0250.010.005123456789101112131415161.

12、00000.81650.76490.74070.72670.71760.71110.70640.70270.69980.69740.69550.69380.69240.69120.69013.07771.88561.63771.53321.47591.43981.41491.39681.38301.37221.36341.35621.35021.34501.34061.33686.31382.92002.35342.13182.01501.94321.89461.85951.83311.81251.79591.78231.77091.76131.75311.745912.7062 4.3027

13、 3.1824 2.7764 2.5706 2.4469 2.3646 2.3060 2.2622 2.2281 2.2010 2.1788 2.1604 2.1448 2.1315 2.119931.8207 6.9646 4.5407 3.7469 3.3649 3.1427 2.9980 2.8965 2.8214 2.7638 2.7181 2.6810 2.6503 2.6245 2.6025 2.583563.6574 9.9248 5.8409 4.6041 4.0322 3.7074 3.4995 3.3554 3.2498 3.1693 3.1058 3.0545 3.012

14、3 2.9768 2.9467 2.92082.144869/101小结70/1018.6 分布拟合检验实际问题中,有时不能知道总体服从什么类型的分布,这时就需要根据样本来检验关于分布的假设。本节介绍2拟合检验法。它可以用来检验总体是否具有某一个指定的分布或属于某一个分布族还有专用于检验分布是否为正态的“偏度、峰度检验法”,留作自学 71/1018.6 分布拟合检验(一)单个分布的2拟合检验法设总体X的分布未知,x1, x2, , xn是来自X的样本值。我们来检验假设lH0:总体X的分布函数为F(x)lH1:总体X的分布函数不是F(x) 其中设F(x)不含未知函数也常以分布律或概率密度代替F(

15、x) , H1可不必写出下面来定义检验统计量72/1018.6 分布拟合检验将H0下X可能取值的全体分成互不相交的子集A1, A2, , Ak以fi (i=1,2,k)记样本观察值x1, x2, , xn中落在Ai的个数,即事件Ai =X的值落在子集Ai 内在n次独立试验中发生fi次,于是在这n次试验中事件Ai发生的频率为fi/n。另一方面,当H0为真时,我们可以根据H0中所假设的X的分布函数来计算事件Ai的概率,得到pi=P(Ai),i=1,2,k。73/1018.6 分布拟合检验频率fi/n与概率pi会有差异,但一般来说,当H0为真,且试验的次数又甚多时,这种差异不应太大,因此(fi/n-

16、pi)2不应太大。我们采用形如 的统计量来度量样本与H0中所假设的分布的吻合程度,其中Ci(i=1,2,k)为给定的常数。 74/101皮尔逊定理定理注意:在单个分布的检验中,要检验的总体是已知的,不含未知参数,如总体是参数为1的泊松分布(1),这时定理中的r=08.6 分布拟合检验75/101注意此即单个分布的2分布拟合检验法8.6 分布拟合检验76/101解试检验这颗骰子的六个面是否匀称?根据题意需要检验假设例1 把一颗骰子重复抛掷 300 次, 结果如下:H0: 这颗骰子的六个面是匀称的. 其中 X 表示抛掷这骰子一次所出现的点数 (可能值只有 6 个), 8.6 分布拟合检验77/10

17、1在H0为真的前提下, 8.6 分布拟合检验78/101所以拒绝 H0, 认为这颗骰子的六个面不是匀称的.8.6 分布拟合检验79/101 例1 下表列出了某一地区在夏季的一个月中由100个气象站报告的雷暴雨的次数. 其中fi是报告雷暴雨次数为i的气象站数试用2拟合检验法检验任一个气象站报告雷暴雨的次数X是否服从均值=1的泊松分布(取显著性水平=0.05)i0123456fi22372013620AiA0A1A2A3A4A5A6解 按题意需检验假设8.6 分布拟合检验80/101在H0下X所有可能取的值为=0, 1, 2, ,将分成如表所示的两两不相交的子集A0, A1, A2, , A6,则

18、有PX=i为 例如 p0=PX=0=e-1=0.36788, p3=PX=3= =0.06131, p6=PX6= =0.059. n=1008.6 分布拟合检验81/101表8-2 例1的2拟合检验计算表:=127.048.03e-1e-1e-1/2e-1/6e-1/24e-1/120Aifipinpifi2/(npi)A0:X=0A1:X=1A2:X=2A3:X=3A4:X=4A5:X=5A6:X62237201362036.78836.78818.3946.1311.5330.3070.05913.1637.2121.7554.92计算结果如表8-2所示,其中有些行npi 7.815,故

19、在显著性水平0.05下拒绝H0,认为样本不是来自均值=1的泊松分布.8.6 分布拟合检验82/101在(一)中要检验的原假设是H0:总体X的分布函数是F(x),其中F(x)是已知的,这种情况是不多的我们经常遇到的所需检验的原假设是 H0:总体X的分布函数是F(x;1, 2, r), 其中F的形式已知,而=(1, 2, r)是未知参数,它们在某一个范围取值在F(x;1, 2, r)中当参数(1, 2, r)取不同的值时,就得到不同的分布,因而F(x;1, 2, r)代表一族分布 (二)分布族的2拟合检验8.6 分布拟合检验83/101在假设中,H0表示总体X的分布属于分布族F(x;1, 2, r

20、)采用类似(一)中的方法来定义检验统计量,将在H0下x可能取值的全体分成k,(kr+l)个互不相交的子集A1, A2, , Ak,以fi (i=1,2,k)记样本观察值x1,x2,xn落在Ai 的个数,则事件Ai=X的值落在Ai内的频率为fi /n另一方面,当H0为真时,由H0所假设的分布函数来计算PAi,得到PAi=pi(1, 2, r) = pi( )=pi此时,需先利用样本求出未知参数的最大似然估计(在H0下),以估计值作为参数值,求出pi的估计值 8.6 分布拟合检验84/101在(6.3)式中以 代替pi, 取作为检验假设H0的统计量可以证明,在某些条件下,在H0为真时近似地有与在(

21、一)中一样可得假设检验问题的拒绝域为为显著性水平以上就是用来检验分布族的2拟合检验法 8.6 分布拟合检验85/101 在一试验中, 每隔一定时间观察一次由某种铀所放射的到达计数器上的粒子数, 共观察了100次, 得结果如下表:例38.6 分布拟合检验86/101解所求问题为: 在水平 0.05 下检验假设由最大似然估计法得在H0假设下,即在X服从泊松分布假设下,X所有可能取的值为 =0,1,2,将分成如表8-4所示的两两不相交的子集A0, A1,A12 8.6 分布拟合检验87/101具体计算结果见下页表 8.5,8.6 分布拟合检验88/101表8.5例3的拟合检验计算表 1 516172

22、611 9 9 2 1 2 1 0 0.015 0.063 0.132 0.185 0.194 0.163 0.114 0.069 0.036 0.017 0.007 0.003 0.002 1.5 6.3 13.2 18.5 19.4 16.3 11.4 6.9 3.6 1.7 0.7 0.3 0.219.39415.62234.845 7.423 7.10511.739664.6155.538=106.2810.0780.0657.8 6.58.6 分布拟合检验89/101故接受 H0, 认为样本来自泊松分布总体.现在2=106.281-100=6.28112. 592 注意 本题答案是“

23、接受H0,认为总体X的分布属于泊松分布族,即认为X()”,亦即“认为必有某一个参数0,X(0)”,而不能将答案误写成“X服从以 =4.2为参数的泊松分布”.8.6 分布拟合检验90/101 自1965年1月1日至1971年2月9日共2231天中,全世界记录到里氏震级4级和4级以上地震共162次, 统计如下:(X 表示相继两次地震间隔天数, Y 表示出现的频数)试检验相继两次地震间隔天数 X 服从指数分布.解所求问题为: 在水平0.05下检验假设例38.6 分布拟合检验91/101由最大似然估计法得X 型随机量, (见下页表)8.6 分布拟合检验92/101503126171086680.278

24、80.21960.15270.10620.07390.05140.03580.02480.056845.165635.575224.737417.204411.9718 8.3268 5.7996 4.0176 9.201655.351927.013227.327016.79808.35307.68606.2073=163.563313.2192表8.6例3的拟合检验计算表14.82698.6 分布拟合检验93/101在 H0 为真的前提下, X 的分布函数的估8.6 分布拟合检验94/101故在水平 0.05 下接受 H0 , 认为样本服从指数分布.8.6 分布拟合检验95/101 下面列出

25、了84个依特拉斯坎人男子的头颅的最大宽度(mm), 试验证这些数据是否来自正态总体?141 148 132 138 154 142 150 146 155 158150 140 147 148 144 150 149 145 149 158 143 141 144 144 126 140 144 142 141 140145 135 147 146 141 136 140 146 142 137148 154 137 139 143 140 131 143 141 149148 135 148 152 143 144 141 143 147 146150 132 142 142 143 153

26、 149 146 149 138142 149 142 137 134 144 146 147 140 142140 137 152 145例48.6 分布拟合检验96/101解所求问题为检验假设由最大似然估计法得(见下页表)8.6 分布拟合检验97/101在 H0 为真的前提下, X 的概率密度的估 1 4103324 9 30.00870.05190.17520.31200.28110.13360.0375 0.73 4.3614.7226.2123.6111.22 3.156.7941.5524.405.0914.374.91表8.5例4的拟合检验计算表=87.6710.028.6 分布

27、拟合检验98/101故在水平 0.1 下接受 H0, 认为样本服从正态分布.8.6 分布拟合检验99/101 一农场10年前在一鱼塘里按如下比例 20 : 15 : 40 : 25 投放了四种鱼: 鲑鱼、鲈鱼、竹夹鱼和鲇鱼的鱼苗. 现在在鱼塘里获得一样本如下:检验各鱼类数量的比例较 10 年前是否有显著改变?例58.6 分布拟合检验100/101解根据题意需检验假设:所需计算列表如下8.6 分布拟合检验101/1011321002001680.200.150.400.2512090240150145.20111.11166.67188.16=611.14表 8.6例5 的拟合检验计算表认为各鱼

28、类数量之比较 10 年前有显著改 变 .故拒绝 H0,8.6 分布拟合检验102/101考试题型:填空、选择、计算;关于考试答题注重过程和步骤:不要只有答案,即使答案错了还有步骤分答题要尽量严谨,比如概率密度函数和分布函数是分段的时候,要写全(-, )如果不会做,但知道些相关概念和思想,也尽量写出来,可能会得到些步骤分期末90%,平时10%(交够80%作业)103/101复习要点:关于考试1. 古典概型、全概率公式和贝叶斯公式;2. 随机变量104/101数理统计部分关于考试105/101本章作业第一次:lP218:2,3,5 第二次:lP219:7,9,12,16,19 第三次:l P221:23,24,27,28 106/101谢谢!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 行业文书

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报