1、应用统计学 应用统计学是一门认识社会和自然的方法论科学。它采用统计方法对社会现象及自然现象总体数量特征方面进行研究。 应用统计学是管理类专业研究生的必修学位课程。教学安排学时14个单元,内容:第一部分:随机变量与概率分布(Chapt 6, 7) ;1.5个单元第二部分:统计数据的整理、描述性指标,抽样分布(Chapt 2, 3, ); 2个单元第三部分:参数估计与假设检验(Chapt 8) ; 3.5个单元教学安排(续)第五部分:时间序列分析(Chapt 5) ; 2.5个单元考核考试 50%平时作业10%,大作业 30%考勤 10%第四部分:回归分析和相关分析(Chapt 10) ; 2.5
2、个单元第一部分:随机变量与概率分布一、基本概念1、随机试验与随机事件现象确定性现象随机性现象必然现象不可能现象概率论研究的对象,研究其内在的客观规律。随机试验 可在相同条件下重复进行 每次试验出现一个且仅一个结果,结果不能够预 先断定。 试验的所有可能结果已知,且不止一个结果。 随机试验的每一个可能的结果称为基本结果,记作。基本结果的全体组成的集合称为样本空间,记作。 随机事件是定义在样本空间上的一个子集合A 。 样本空间为必然事件,空集为不可能事件 。例1 掷筛子,样本空间 = 1,2,3,4,5,6 随机事件A1= 掷得的点数大于4=5,6 随机事件A2= 掷得的点数为偶数=2,4,6例2
3、 随机抽查由甲、乙送检的产品的合格情况, 样本空间 = (甲,合格), (甲,不合格), (乙,合格), (乙,不合格) 随机事件A1= 抽得不合格品=(甲,不合格), (乙,不合格)事件的关系及运算: 包含: A B 和 : AB 交 : AB = AB 差 : A B 对立(逆): A = 互斥(不相容): AB=,A,B互斥时, AB记为A+B关系: 运算的性质A(BC)= (AB)C; (A B) C = A (B C) AB=BA例3 设A,B,C为三个随机事件,试以A,B,C的运算表示 下列事件: 仅A发生; A,B,C中恰有一个发生;A,B,C中至少有 一个发生;A,B,C均不发
4、生。2、概率古典概型:P(A)=A所包含基本结果的数量/所包含基本结果的数量= n / N几何概率:试验概率:主观概率:概率的公理化定义:设上的随机事件组成的集合,P为定义在上的函数,足 P(A) 0,对任何A 成立; P() = 1; 若A1, A2, , Am互不相容,有P(A1+ A2+)=P(A1)+P(A2)+.3 条件概率定义:设A、B为两个随机事件,且P(B)0,称P(A|B)=P(AB)/P(B)为B发生条件下,A发生的条件概率。乘法公式: P(AB) = P(B) P(A|B) = P(A) P(B|A) 4 随机事件的独立性定义:若 P(AB) = P(A) P(B) ,称
5、随机事件A,B相互独立。 5 全概率公式与贝叶斯公式 设随机事件A1, A2, , Am互不相容,且P(Ai)0,则对任何一事件B,有发射台接收台A1 0A 210 B11 B2例40.80.20.10.9设 P(A1)=0.6, P(A2)=0.4,求 P(A1|B1)1、随机变量二、随机变量及其概率分布随机试验样本空间=1, 2,随机事件A: 的子集数值集合x1, x2,随机变量X随机变量X的某一个取值范围随机变量:定义在样本空间上的一个实变函数。实验结果数量化例5 设袋中装有依次标有-1,0,0,1的4个球,从袋中任取一个球,用X表示取得的球上标记的数值。例6 从一批次品率为p的产品中有
6、放回的抽取产品进行检验,直至抽得次品为止。用X表示抽取的次数。例7 从一批次品率为p的产品中有放回的抽取n件产品进行检验,用X表示抽得次品的次数。 例8 点目标射击,用X表示击中点(x, y)与目标点(0, 0)的距离。例9 出租车通过十字路口,用X表示等待时间长度。2、离散型随机变量的概率分布(1)分布律与分布函数设X为随机变量,x1, x2, , xk, 为X的所有可能取值,则称 PX=xi= pi (i=1,2,3, )为X的分布律。称为X的分布函数。例5中X的分布律:X-101Pi0.250.50.25X的分布函数F(x)为10.750.25-1 0 1 xF(x)(2) 常见离散分布
7、变量两点分布(贝努里分布,或(0,1)分布) 分布律:PX=1= p,PX=0= q =1- p 分布函数:1q-1 0 1 xF(x)二项分布(n重贝努里分布)B(n, p):相互独立n次贝努里试验中事件A出现的次数 分布律:Poisson分布 分布律:几何分布(例6) 分布律:(3)随机变量的统计独立性 设X与Y为离散随机变量,若对于所有的xi,yj,有 P(X= xi,Y=yj) = P(X= xi)P(Y=yj) 成立 称X与Y,若相互独立。(4)离散随机变量的数学期望E(X)与方差D(X) 数学期望(均值)代表了X 概率分布的集中趋势,是重要的数字特征。公式为方差D(X)的性质: D
8、(C) = 0,C为常数;D(CX) = C2 D(X); 若X与Y相互独立,则D(XY) = D(X) D(Y) 两点分布X的方差D(X) = pq;二项分布X的方差D(X) = npq;Poisson分布X的方差D(X) = t;几何分布X的方差D(X) =q/p2方差描述了X 概率分布的离散状况,即偏离均值的程度。公式为D(X) = E(X-E(X)2 = E(X2) (E(X)2 数学期望E(X)的性质: E(C) = C,C为常数;E(CX) = C E(X);E(XY) = E(X) E(Y) ; 若X与Y相互独立,则 E(XY) = E(X) E(Y) 两点分布X的均值E(X)
9、= p;二项分布X的均值E(X) = np;Poisson分布X的均值E(X) = t;几何分布X的均值E(X) =1/p3、连续型随机变量的概率分布(1)分布密度函数,均值与方差设随机变量X的分布函数为F(x),若存在非负函数f (x),使得对于任意实数x,有称X为连续型随机变量,并称f (x)为X的概率密度。概率密度f (x)有如下性质: f (x) 0,- x + ; 对于任意实数a,b,且a b 有 若f (x)在x点处连续,则有连续型随机变量的分布函数F(x)必为连续函数。(2) 常见的连续分布变量a,b上的均匀分布X称为X 的均值为X 的方差指数分布X正态分布X 记为N(, 2),
10、特别当 = 0, =1时称为标准正态分布,记作N(0, 1),其分布函数记作(x)。正态分布X的性质: f (x)关于 x = 对称,呈钟形; 越小,曲线越陡。 f (x) f ( ) ;当x 趋于正负无穷大时, f (x) 以 x 轴为渐近线 f (x)与 x 轴所围面积等于1。 0 xf(x) 对于一般正态分布N(, 2)的随机变量X,经过线性变换Y= (X- )/ ,则Y为标准正态分布。4、协方差与相关系数定义:设(X,Y)为二维随机变量,若E(X-E(X)(Y-E(Y)存在,则称其为X与Y的协方差,记为Cov (X, Y)。协方差的性质: Cov (X, Y) = Cov (Y, X)
11、 。 Cov (aX, bY) = ab Cov (X, Y) Cov (X1+X2, Y) = Cov (X1, Y) + Cov (X2, Y) 若X与Y相互独立,则Cov (X, Y) = 0 若E(X2),E(Y2)存在,则Cov (X, Y)2 D(X)D(Y)Cov (X, Y)=E (XY)- E (X) E (Y)定义:称为X与Y的相关系数,记为X,Y相关系数的性质:若X与Y相互独立,则X,Y = 0 |X,Y| 1 |X,Y| = 1的充要条件是:存在常数a, b ,使得PY= a+bX=1定义:若X,Y = 0 ,称X与Y不相关。随机现象的统计规律性,只有在相同条件下进行大量的重复试验才能够体现出来,随着试验次数N的增加,时间的频率趋于它的稳定值,即概率。大数定理:在随机试验过程中,每次的结果不同,但是大量重复试验的结果的平均值的极限总是存在的。大数定理是统计推断的最重要的理论基础之一中心极限定理:设X1 , X2, , Xn服从为独立同分布随机变量,均值为, 方差为2,则随机变量X5 大数定理与中心极限定理当n 很大时,其分布渐近于N(n, n2),若 0 渐近于N(0, 1)