1、第七章 参数估计 数理统计的目的是进行统计推断,而统计推断的基本 问题可以分为两大类,一类是估计问题,另一类是假 设检验问题。在本章我们将要考虑的是估计问题。 所谓参数估计就是: 对于总体X,其分布形式已知 ,但其中 为未知参数,现在从总体中抽出一个简单 随机样本 ,要依据这个样本去对未知参 数 的值作出估计。 一种是点估计;另一种是区间估计。 我们先考虑点估计 参数估计有两种类型: 例:已知一批电视机的寿命服从正态分布,但期望和 方差未知,现从中抽取一个容量为4的样本,测得样本 值为(1453,1502,1367,1650)。现在要根据样本 来估计总体的期望和方差。 由于样本是总体的“代表”
2、,所以用样本均值来 估计总体均值(期望),用样本方差来估计总体方差 是比较“合理”的.当然也可以用其他”合理”的办法来 估计. 注意:样本均值和样本方差都是统计量 1 点 估 计 一、点估计的概念 设总体的分布函数为 , 是 的 一个样本, 是相应的一个样本值,点估计问题 就是要构造一个“合理”的统计量 ,用 它的观察值 作为未知参数 的估计值, 称 为 的估计量,称 为 的估计值。估计量和估计值统称为估计,简记为 。 由此可见,点估计的关键在于构造一个“合理”的估计 量。那么根据什么原理来构造估计量呢 二、 点估计的常用方法 1. 矩估计法 原理: 设 是来自总体 的样本,由大数定理可 知
3、,矩估计就是根据这一原理 来构造估计量的,即用样本矩来估计总体矩。 由 来进行未知参数的估计。 进一步还可以用样本矩的函数来估计总体矩的函数. 当总体是连续型随机变量概率密度为 (其中 是 个未知参数),则 当总体是离散型随机变量,其分布律为 则 方法: 第一步:求总体矩 解出 ,就以 作为 的估计 , 称之为矩估计量,矩估计量的观察值 称为矩估计值。 通常取k=1最简单,但有时E( X )= 0,这时可取 K = 2或K = 3等等。 第二步:用相应的样本矩 作为总体矩的估计 例:求下列总体分布中的未知参数的矩估计 (1) 其中c是已知参数. (2) p 是未知参数 (3) X U(a,b)
4、 ,求 a,b的矩估计量. (4) 教材173页第4题(求矩估计量和矩估计值) 2、 最大似然估计法 基本思想:如果事件A在一次试验中就发生,有理由 认为该事件发生的概率很大,即P(A)很大。 最大似然估计就是根据这一思想来估计未知参数的。 若一次试验就取得样本值 ,这就意味着 取到这组样本值的概率很大。 (i) 对离散型随机变量,设总体的分布律为 则样本 的分布律为 最大似然估计就是确定参数 ,使事件 的概率 为最大。 若记 则称 为 的最大似然估计值,称 为 的最大似然估计量。L称为似然函数. (ii) 对连续型随机变量,设总体 的概率密度为 则样本 的概率密度为 最大似然估计就是要选取
5、使 达到最大。 设 是对应于样本 的一个 样本值,令 把 看作是 的函数,称这个函数为似然函数. 这样,最大似然估计的问题就归结为求似然函数的最大 值的问题了。因此由以下的似然方程组 就可以求得 的最大似然估值 。 又因为似然函数 与 在同一处取到极值, 因此 的最大似然估计 也可以从对数似然方程组 求得。这样往往计算更简单. 最大似然估计的计算步骤: (1) 写出似然函数; (2) 求对数; (3) 求导数; (4) 解方程. 例1:总体概率密度为 其中c是已知参数,求 的最大似然估计. 例2: 总体 的最大似然估计. 例5: 总体 的最大似然估计. 例4: 总体 的最大似然估计. 例3:
6、总体 的最大似然估计. 例6: 总体 的最大似然估计 例7: 教材173页第4题 3 估计量的评选标准 1、无偏性 若估计量 的数学期望 存在, 且 ,则称 是 的 无偏估计(量)。 例1:证明: 样本均值 是总体均值 的无偏估计; 证明:样本方差 是总体方差 的无偏估计, 而估计量 却不是 的无偏估计。 因为 定义:若对于 的估计量 有 ,则称 是 的渐进无偏估计(量) 例2.设 是参数 的无偏估计,且 证明 : 不是 的无偏估计. 所以不是 的无偏估计.但是随n的增大它越来越接近 我们称之为渐进无偏估计. 由此可知若 是参数 的无偏估计,但 不一定就 是 的无偏估计. 2、 有效性 设 与
7、 都是 的无偏估计量,若 则称 比 有效。 例3. 是来自总体X的一个样本, 哪些是总体均值的无偏估计,哪一个最有效. 3、相合性(一致性) 设 为参数 的估计量,若 当 时, 依概率收敛于 , 即对于任意 ,有 则称 是 的相合估计量。 这就是说样本容量越大,越能够反映总体的真实情况. 例5: 设总体 的概率密度为 是取自 的简单随机样本,求 (1) 的矩估计量 ;(2) 的方差 ; (3)判别这个估计是否无偏估计。 例4. 是总体X的一个样本当c为何值时 是总体方差的无偏估计. 例6:设 是总体 的两个独立样本 例7:设总体 的概率密度为 其中 是未知参数, 是来自总体 的一个容量为 的简
8、单随机样本,分别用矩 估计法和最大似然估计法求 的估计量。 例8:设某种元件的使用寿命 的概率密度为 其中 为未知参数,设 是 的一组 样本观测值,求参数 的最大似然估计值。 例9:设 是总体 的一个样本, 求 的最大似然估计. 4 区间估计 一、置信区间的定义 设总体 的分布函数 含有一个未知参数 , ( 是 可能取值的范围)对于给定值 ,若由样本 确定的两个统计 量 和 , 满足: 则称随机区间 是 的置信水平为 的 置信区间, 和 分别被称为置信水平 的双侧置信区间的置信下限和置信上限。称 为置信水平(度)。 例: 设总体 是总体的一个样本,求 的置信 水平为 的置信区间. 解: 因为 ,由标准正态分布的双侧 分位点的定义可知: 注:下面讨论的都是正态总体的区间估计,对于非正态总 体的情况都要利用中心极限定理把它化为正态的情况 但要注意这时 n 必须很大,即要采取大样本. 这样就得到了置信区间 再把样本值代入,就