1、12014 中级统计师考试 -统计方法知识考试重点归纳第一章 统计和数据第二章统计是用来处理数据的,是关于数据的一门学问。1、统计学:是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。2、统计分析数据的方法分为:(1)描述统计 (2)推断统计3、描述统计:是研究数据搜集、处理和描述的统计学方法。4、推断统计:是研究如何利用样本数据来推断总体特征的统计学方法。5、推断统计包括:(1)参数估计 (2)假设检验6、定性变量的特点:只反映现象的属性特点,不能说明具体量的大小和差异。定性变量包括分类变量和顺序变量。只反映现象分类特征的变量称分类变量。分类变量没有数值特征,所以不能对其数据进
2、行数学运算。如果类别具有一定的顺序,这样的变量称为顺序变量。顺序变量不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。7、定量变量的特点:可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异。 数值型数据(定量数据)作为统计研究的主要资料,其特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差,而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差。其计量精度远远高于定性数据。在统计学研究中,数值型数据有着最广泛的用途。8、数据按获取的方法不同分为:(1)观测数据 (2)实验数据
3、9、观测数据:是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。10、实验数据:一般是在科学实验环境下取得的数据。11、统计数据资料的来源:(1)通过直接的调查或实验获得的原始数据,这是统计数据的直接来源;(2)别人调查的间接数据,并将这些数据进行加工和汇总后公布的数据,这是数据的间接来源。12、数据的直接来源:(1)统计调查 (2)实验法通过统计调查得到的数据,一般称为观测数据。运用实验法时,实验组和对照组的产生应当是随机的。13、数据的间接来源:(1)公开出版的统计数据 (2)尚未公开发表的统计数据14、搜集数据的方法:(1)普查 (2)抽样调查 (3)
4、统计报表 (4)重点调查 (5)典型调查215、普查:是专门组织一次性的全面调查,用来调查属于一定时点或时期内的社会现象总量。普查适用于搜集某些不能或不适宜于定期的全面统计报表搜集的统计资料,以摸清重大的国情、国力。16、普查的特点:(1)是一种全面调查,具有资料包括范围全面、详尽、系统的优点。(2)是一次性的专门调查,因为普查的工作量大,耗资也多,时间周期较长,一般不宜经常举行。17、抽样调查的特点:(1)样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响。(2)能够根据部分调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识。(3)在抽样调查中会存在抽样误差,
5、但是这个误差可以事先计算并加以控制。18、在实际调查中抽样的方法:(1)概率抽样 (2)非概率抽样19、常用的概率抽样形式有:(1)简单随机抽样 (2)分层抽样 (3)整群抽样(4)系统抽样20、分层抽样:是先将总体各单位按主要标志加以分层,然后在每一层内进行抽样。21、系统抽样:又称等距抽样,是在总体的名录框中每隔一定距离抽选一个被调查者。22、统计报表:是按照国家统一规定的调查要求与文件自下而上的提供统计资料的一种调查方式。23、统计报表按照报送范围分为:(1)全面报表 (2)非全面报表24、统计报表的内容包括:(1)表式 (2)填表说明25、重点调查:是在调查对象中选择一部分对全局具有决
6、定性作用的重点单位进行的一种非全面调查。当调查的任务只要求掌握事物的基本状况与基本的发展趋势,而不要求掌握全面的准确资料,而且在总体中确实存在着重点单位时,进行重点调查是比较适宜的。26、典型调查:是一种非全面的调查,是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。27、典型调查的作用:(1)补充全面调查的不足(2)在一定条件下可以验证全面调查数据的真实性典型调查具有灵活机动、通过少数典型即可取得深入详实的统计资料的优点,但是易受人们主观认识上的影响,必须同其他调查结合起来使用,才能避免出现片面性。第二章 数据描述31、定性
7、数据的图形表示有:(1)饼图 (2)条形图 (3)环形图饼图是利用圆形及圆内扇形面积来表示数值大小的图形。条形图是用宽度相同的条形的高度或长度来表述数据多少的图形。如果想比较不同变量之间的结构差异,可以通过环形图来实现。定性数据的图示表示方法,也都适用于定量数据。但定量数据还有一些特定的图示方法,它们并不适用于定性数据。2、频数:是指频数分布表中落在某一特定类别的数据个数。3、生成定量数据的频数分布表的步骤:(1)对数据进行分组 (2)确定组距 (3)统计出各组的频数及频数分布表组距是每个组变量值中的最大值与最小值之差,也就是上限与下限之差。4、在确定组距时应掌握的原则:(1)要考虑各组的划分
8、是否能区分总体内部各个组成部分的性质差别。(2)要能准确地清晰地反映总体单位的分布特征。在确定组距时,在研究的现象变动比较均匀的情况下,可以采用等距分组;而当研究的现象变动很不均匀时,一般采用不等距分组。在统计各组频数时,恰好等于某一组的组限时,则采取上限不在内的原则,即将该频数计算在与下限相同的组内。5、定量数据的图形表示有:(1)直方图 (2)折线图 (3)散点图直方图的横坐标代表变量分组,纵坐标代表各变量值出现的频数。6、统计表的五个组成部分:(1)表头 (2)行标题 (3)列标题 (4)数字资料 (5)表外附加7、数据的分布特征:(1)集中趋势,即一组组数据的数值向其中心值的靠拢程度(
9、2)离散程度,即一组数据的各个数值远离其中心的趋势和程度8、定性数据的集中趋势常用的计算方法:(1)百分比 (2)中位数 (3)众数9、中位数:是数据按照大小排列之后位于中间的那个数。如果样本量为偶数,则是中间两个数的平均。10、众数:就是数据中出现次数或出现频率最多的数值。11、反映定量数据特征的统计量有:反映数据集中趋势的水平度量:(1)平均数 (2)中位数 (3)众数 (4)分位数反映数据离散程度的差异度量:(1)极差 (2)四分位差 (3)标准差 (4)方差平均数易为多数人理解和接受,实际中用的也较多,但主要缺点是更容易受少数极端数值的影响。中位数和众数提供的信息不像平均数那样多,但具
10、有统计上的稳健性,当数据为偏态分布,特别是偏斜程度较大时,中位数和众数的代表性要比平均数好。12、极差:又称全距,是一组数据中的最大值和最小值之差。极差非常容易受数据中极端值的影响。方差用 表示,总体标准差用 表示,样本标准差用 表示,离散系数用 表2s4示,标准分数用 表示。Z标准差是方差的平方根,它与方差相比更具量纲性。在一个统计样本中,其标准差越大,说明它的各个观测值分布的越分散,它的趋中程度就越差。反之,其标准差越小,说明它的各个观测值分布的越集中,它的趋中程度就越好。标准差的大小会受到数据本身数值大小的影响。两个数列的标准差相同,但是两数列的差异程度却不同。为了更准确地反映差异程度,
11、要计算离散系数。13、离散系数:是将一组数据的标准差除以其均值,用来测度数据离散程度的相对数。14、标准分数:是变量值与其平均数的离差除以标准差后的值,用以测定某一个数据在该组数据中的相对位置。第三章 参数估计1、总体分布:是总体中所有观测值所形成的分布。2、总体参数:是对总体特征的某个概括性的度量。3、总体参数指标有:(1)总体平均数( ) (2)总体方差( ) (3)总体比例( )等。2统计量是样本的函数。构成统计量的函数中不能包含未知因素。4、样本统计量指标有:(1)样本均值( ) (2)样本方差( ) (3)样本比例( )x2sp统计量的概率分布构成了推断总体参数的理论基础。5、关于样
12、本均值的抽样分布:(1)设总体共有 个元素,从中随机抽取一个容量为 的样本,在重置抽样时,Nn共有 种抽法;在不重复抽样时,共有 个样本。n )!(NCn(2)样本均值的抽样分布就是指所有可能抽出来的样本 的分布。x(3)样本均值的均值就是总体均值,即 。)(xE(4)重置抽样时,样本均值的标准差为总体标准差 的 ,即 ;n1x不重置抽样时,样本均值的方差为 。2Nnx(5)当总体服从正态分布时,样本均值一定服从正态分布,即有: 时, 。X),(2Nx),(2nN(6)若总体为未知的非正态分布时,只要样本容量 足够大(通常要求 30),样nn本均值 仍会接近正态分布,其分布的期望值为总体均值,
13、样本方差为总体方差x的 。n1(7)如果总体不是正态分布,当 为小样本时(通常 30),样本均值的分布则nn不服从正态分布。56、关于样本比例的抽样分布:(1)当样本容量比较大时,样本比率 近似服从正态分布,且有 的数学期望pp就是总体比率,即 。)(pE(2)在重置抽样时, 的方差为 。np)1(2(3)在不重置抽样时, 的方差为 。N(4)在重置抽样时, 的分布为 )(,(5)在不重置抽样时, 的分布为 p1n7、关于统计量的标准误差:(1)统计量的标准误差用于衡量样本统计量的离散程度。在参数估计中,用于衡量样本统计量与总体参数之间差距。(2)样本均值的标准误计算公式为: nx(3)当总体
14、标准差 未知时,可用样本标准差 代替计算,这时计算的标准误差s称为估计标准误差。(4)样本比例的标准误计算公式为: np)1((5)当总体比例的方差 未知时,可用样本比例的方差 代替。)1()1(p8、参数估计:就是用样本统计量去估计未知的总体参数。9、用样本统计量估计总体参数的两种方法:(1)点估计 (2)区间估计10、常用的点估计有:(1)用样本均值 估计总体均值 (2)用样本比例 估计总体比例xp(3)用样本方差 估计总体方差2s11、区间估计:是包括样本统计量在内的一个区间,该区间通常是由样本统计量加减估计标准误差得到的。12、关于区间估计:(1)标准正态分布 (0,1)的均值为 0,
15、标准差为 1。N(2)标准化的公式为: (观测值-均值)标准差Z(3)以 68.27%的置信水平推断总体参数 的置信区间为 :)(z),(nx(4)以 95.45%的置信水平推断总体参数 的置信区间为 :)2(z)2,(nx(5)以 99.73%的置信水平推断总体参数 的置信区间为 :)3(z)3,(nx13、评价估计量的标准有:(1)无偏性 (2)有效性 (3)一致性无偏性是指估计量抽样分布的期望值等于被估计的总体参数。 、 、 分别xp2s6是总体均值 、总体比例 、总体方差 的无偏估计量。2有效性是指估计量的方差尽可能小。对同一个总体参数的两个无偏估计量,有更小方差的估计量更有效。一致性
16、是指一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数。样本均值是总体均值的一个一致估计量。14、关于总体均值的区间估计:(1)在对总体均值进行区间估计时,需要考虑总体是否为正态分布、总体方差是否已知、用于估计的样本是大样本( )还是小样本( )等情况。30n30n(2)大样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平下的置信区间为1 nzxz22,(3)大样本情况下,总体服从正态分布,总体方差未知,总体均值在置信水平下的置信区间为1 nszxsz22,(4)小样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平下的置信区间为1 nzxz22,(5)小样
17、本情况下,总体服从正态分布,总体方差未知,总体均值在置信水平下的置信区间为1 nstxst22,关于总体比例的区间估计,在大样本条件下,若 , ,则二5p5)1pn(项分布可用正态分布近似,在 的置信水平下的置信区间为1。 npzpnzp,122样本量与置信水平成正比关系,与总体方差成正比,与允许的估计误差的平方成反比。如果总体比例 的值不知道可以用样本比例 代替,或者取 =0.5,使得p达到最大。1第四章 假设检验1、假设检验:是先对总体参数或分布形式提出某种假设,然后利用样本信息和相关统计量的分布特征去检验这个假定,做出是否拒绝原来假设的结论。2、小概率事件:是指在一次事件中几乎不可能发生
18、的事件,一般称为“显著性水平” ,用 表示。显著性水平一般取值为 =0.05 或 =5%。3、假设检验的过程:(1)提出原假设和备择假设(2)确定检验统计量(3)确定显著性水平 (4)根据数据计算检验统计量值和与这个统计量值对应的概率值 值,并进行决P策7原假设也称为零假设,记为 ;备则假设也称为备选假设,记为 。0H1H在对总体的均值进行检验时,大样本应用正态分布检验,计算 统计量,小样z本一般用 分布检验,计算 统计量。tt拒绝正确零假设的错误称为第一类错误或弃真错误( ) ;当备选假设正确时反而说零假设正确的错误称为第二类错误或取伪错误( ) 。4、对假设检验的总结:(1)假设检验依据的
19、是小概率原理(2)小概率标准在抽样前依需要确定(3)假设检验的结果只能是拒绝或不拒绝原来假设,而不能证明原假设成立(4)统计假设检验的结果不是绝对正确5、关于总体均值的假设检验:(1)在对总体均值进行假设检验时,采用什么检验统计量,取决于所抽检的样本是大样本( )还是小样本( ) ,还需要考虑总体是否为正态分布、30n30n总体方差是否已知等情况。(2)大样本情况下,当总体方差已知时,总体均值检验的统计量为: nxz/(3)大样本情况下,当总体方差未知时,总体均值检验的统计量为: s/(4)小样本情况下,当总体均值服从正态分布,总体方差已知时,总体均值检验的统计量为: nxz/(5)小样本情况
20、下,当总体均值服从正态分布,总体方差未知时,总体均值检验的统计量为: nsxt/6、总体比例的检验的三种基本形式:(1)双侧检验: ,00:H01:(2)左侧检验: ,(3)右侧检验: ,00:01:总体比例的假设检验,在大样本时,样本比例会近似服从正态分布,所以检验统计量仍用 统计量,其基本形式为:Znpz)( 01第五章 相关分析与回归分析1、相关关系:是存在着密切的联系但又不是严格的、确定的关系。2、相关关系根据相关的形态分为:(1)线性相关 (2)非线性相关3、相关关系根据相关的方向分为:(1)正相关 (2)负相关正相关是两个变量的变动方向总体上相同,负相关是两个变量变动的方向总体8上
21、相反。4、相关系数:是测定变量之间关系密切程度的量,它能够以数字准确地描述变量之间的相关程度。5、关于相关系数 :r(1) 的取值范围为-1 1。 值越接近 1(或-1)就越正(或负)相关,越rr接近 0 就越不相关。(2) 具有对称性。 与 之间的相关系数 和 与 之间的相关系数 相等。xyxy yxr(3) =0 只表示两个变量之间不存在线性相关,并不表明变量之间没有任何关系。r回归方程的拟合程度分析最常用的指标是判定系数 。 的取值范围在0,1,2R=1 时,拟合是完全的,即所有观测值都在直线上。 越接近于 0,回归直线2R的拟合程度越差。估计标准误差 也是说明回归直线拟合程度的指标,
22、越小,根据回归方程进es es行预测就越准确。第六章 时间序列分析1、时间序列:是指反映社会、经济、自然现象的数据按时间先后顺序记录形成的数列。2、时间序列的两个构成要素:(1)现象所属的时间 (2)对应不同时间的统计指标数值3、反映时间序列增长量的指标有:(1)发展水平 (2)增长量 (3)平均增长量4、增长量:是指时间序列中两个不同时期的发展水平之差,反映社会经济现象报告期比基期增加或减少的数量。5、增长量的计算公式:增长量=报告期水平-基期水平6、增长量根据采用的基期不同分为:(1)逐期增长量 (2)累计增长量7、逐期增长量:是报告期水平与前一期水平之差,说明报告期比前一时期增长的绝对数
23、量。8、累计增长量:是报告期水平与某一固定时期水平之差,说明本期比某一固定时期增长的绝对数量,也说明在某一较长时期内总的增长量。逐期增长量之和等于相对时期的累计增长量。9、反映时间序列增长率的指标有:(1)发展速度 (2)增长速度 (3)平均发展速度 (4)平均增长速度10、发展速度:是表明现象发展程度的动态相对指标,它是两个不同时期的发展水平对比的结果。11、发展速度的计算公式:发展速度=报告期水平基期水平100%12、发展速度根据采用的基期不同分为:(1)环比发展速度 (2)定基发展速度913、环比发展速度与定基发展速度的关系:(1)环比发展速度的连乘积等于对应的定基发展速度(2)相邻时期
24、的两个定基发展速度相除的商等于相应的环比发展速度14、增长速度:是表明现象增长程度的动态相对指标。15、增长速度的计算公式:增长速度=增长量基期发展水平=发展速度-116、平均发展速度:是一定时期内各个环比发展速度的平均数。17、平均发展速度与平均增长速度的关系:平均增长速度=平均发展速度-118、时间数列的四个影响因素:(1)长期趋势 (2)季节变动 (3)循环变动 (4)不规则变动19、长期趋势的分析方法:(1)回归方程法 (2)简单移动平均法 (3)指数平滑法20、直线趋势方程的一般公式: btaTt式中: 表示时间数列的长期趋势;t表示时间数列中指标所属的时间;、 为待定参数。ab21
25、、季节变动的三个特点:(1)季节变动每年重复进行 (2)季节变动按一定的周期进行(3)每个周期变化强度大体相同22、季节指数法的两个缺陷:(1)没有考虑长期趋势的影响 (2)季节比率的高低受各年平均数值大小的影响第七章 统计指数1、指数按其反映对象范围不同分为:(1)个体指数 (2)综合指数2、指数按其表明的经济指标性质不同分为:(1)数量指数 (2)质量指数产量指数、销售量指数、职工人数指数等为数量指数。价格指数、单位成本指数、劳动生产率指数等为质量指数。3、计算加权综合指数的两种方法:(1)拉氏指数 (2)派氏指数4、居民消费价格指数的作用:(1)1经济学基础知识重点第一章 需求、供给和市
26、场机制的作用1、需求:是指消费者在各种价格水平上,愿意并且能够购买的商品数量。2、需求法则:就一般商品来说,需求和价格呈现反向变动的关系,即在其他因素不变的情况下,商品的价格越高,对商品的需求量越低,反之则反。需求曲线表现为一条向右下方倾斜的曲线,其斜率为负。吉芬商品属于需求法则的例外。一种商品只有同时具备“是劣等品”和“收入效应大于替代效应”这两个条件时,才可以被称之为吉芬商品。3、需求量:是指在某一特定价格水平上,消费者愿意并且能够购买的商品数量,它由需求曲线上的某一点来表示。4、需求量的变动:是指在假定其他条件不变的情况下,由于商品价格自身的变动所引起的商品购买量的相应变动。与需求量不同
27、,需求并非指某一特定的需求量,而是指在各种可能的价格水平上,所有的特定需求量的集合。5、需求的变动:是指在假定商品自身价格不变的情况下,由于其他因素的变化所引起的,在各种可能的价格水平上需求量变化的全部情况。6、影响需求变动的主要因素:(1)消费者的可支配收入 (2)消费者的偏好 (3)相关商品的价格 (4)消费者对商品价格的预期相关商品包括替代品和互补品。如果某种商品的替代品的价格发生变动,则该种商品的需求与替代品价格成同方向变化,替代品价格的提高(降低)将引起该商品需求的增加(减少) 。如果某种商品的互补品的价格发生变动,则该种商品的需求与互补品价格成反方向变化,互补品价格的提高(下降)将
28、引起该商品需求的降低(增加) 。需求价格弹性指某一商品的需求量(Q)对它本身价格(P)变化的反应程度,即 Ed=(QQ)/(PP)。Ed1 表明需求量对价格变化反应强烈,这类商品为高档消费品(奢侈品);Ed1 表明需求量对价格变化反应缓和,这类商品为生活必需品。7、恩格尔系数的计算公式:恩格尔系数=消费者用于购买食品的支出消费者的可支配收入恩格尔系数在 59%以上为贫困,5059%为温饱,4050%为小康,3040%为富裕,低于 30%为最富裕。8、供给法则:在其他因素不变的情况下,供给量与价格同方向变动,市场价格越高,卖方愿意为市场提供的产品数量越多;价格越低,供给量越少。供给曲线表现为一条
29、向右上方倾斜的曲线,其斜率为正。供给价格弹性指某一商品的供给量对它本身的价格变化的反应程度,即Es=(QQ)/(PP)。Es1,表明供给量对价格的变化反应强烈,这类商品多为劳动密集型或易保管商品;Es1,表明供给量对价格的变化反应缓慢,这类商品多为资金或技术密集型或不易保管商品。9、供给量的变动:是指在假定其他条件不变的情况下,由于商品价格自身的变动所引起的出售量的相应变动。10、供给的变动:是指在假定商品自身价格不变的情况下,由于其他因素的变化所引起的,在各种可能的价格水平上供给量变化的全部情况。11、影响供给变动的主要因素:(1)投入要素的成本 (2)技术水平 (3)厂商对未来商品的价格预
30、期在其他因素不变的条件下,生产成本的提高会减少利润,从而使得商品生产者不愿意生产,进而减少供给量。2技术水平的提高可以降低生产成本,增加生产者的利润,生产者愿意提供更多的产量。12、均衡价格:是指该种商品的市场需求量和市场供给量相等时的价格。一种商品市场的均衡出现在该商品的市场需求曲线和市场供给曲线相交的交点上,该交点被称为均衡点。均衡价格的计算:P145 例13、供求法则:(1)供给不变,需求变动的影响:需求增加,则均衡价格、均衡数量均增加;需求减少,则均衡价格、均衡数量均减少。(2)需求不变,供给变动的影响:供给增加,则均衡价格下降,均衡数量增加;供给减少,则均衡价格增加,均衡数量减少。政
31、府干预市场的手段主要表现为价格控制,即制定支持价格或限制价格。第二章 市场失灵与政府的微观经济政策1、市场达到一般均衡的表现:(1)消费效用极大化 (2)企业利润最大化 (3)市场总供给与总需求相等2、达到帕累托最优会同时满足的条件:(1)交换最优 (2)生产最优 (3)交换和生产最优3、导致市场失灵的主要原因:(1)外部性 (2)垄断 (3)公共物品 (4)信息不完全4、正外部性:当市场主体的活动对其他成员的影响为正面影响,即其他成员从中获得好处时,这种活动导致的外部性称为正外部性。正外部性的特征是私人成本高于社会成本,而其收益低于社会收益。5、负外部性:当市场主体的活动对其他成员的影响为负
32、面影响,即其他成员因此而受到损失时,这种活动导致的外部性称为负外部性。负外部性的特征是私人成本低于社会成本,而其收益高于社会收益。无论是哪种外部性,都表明资源没有实现最优配置,没有达到帕累托最优。6、垄断形成的原因:(1)对关键资源或关键原材料的控制或占有(2)专利制度 (3)规模经济 (4)准入制度既有排他性又有竞争性的物品称为私人物品。根据非竞争性与非排他性的程度,公共物品分为纯公共物品与准公共物品。纯公共物品具有完全的非竞争性与非排他性,而准公共物品只具有部分的非竞争性与非排他性。7、政府消除外部性的微观经济政策有:(1)使用税收和补贴手段 (2)合并相关企业 (3)明晰产权科斯定理认为
33、,只要产权是明晰的,并且其交易成本为零或很小,则无论在开始时将产权赋予谁,市场均衡的最终结果都是有效率的。公共物品的有效生产问题不可能通过竞争的市场机制来解决,由政府来生产公共物品是一种较好的选择。第三章 宏观经济运行与生产总量的衡量1、两部门宏观经济均衡的条件:S-I=0,即储蓄(S)=投资(I)2、国民生产总值(GDP)的三种不同核算方法:(1)从生产角度看:GDP=增加值=(总产出-中间消耗)(2)从收入角度看:GDP=增加值=(劳动报酬+生产税净额+固定资产折旧+营业盈余)3(3)从支出角度看:GDP=最终产品=(总消费+总投资+净出口)=(私人消费+私人投资+政府购买+净出口)从生产角度