1、相关分析1.变量间的关系2.相关关系描述3.相关关系测度函数关系1.是一一对应的确定关系2.设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量。x xy y相关关系(correlation)1.变量间关系不能用函数关系精确表达2.一个变量的取值不能由另一个变量唯一确定3.当变量 x 取某个值时,变量 y 的取值可能有几个x xy y相关分析(correlation analysis)相关分析是用来度量变量之间关系的技术,通常借助的工具
2、有散点图和相关系数等。相关关系描述 (a)不完全正线性相关(b)不完全负线性相关(c)完全正线性相关(e)曲线相关(d)完全负线性相关(f)不相关相关系数(correlation analysis)相关系数是度量两个数值型变量之间线性相关程度的统计量。总体相关系数:样本相关系数:相关系数(correlation analysis)相关系数(correlation analysis)(1)相关系数 在-1,1之间取值。:两个变量呈完全线性相关,即线性函数关系。越接近1,表明线性关系程度越强;越接近于0,表明线性关系越弱。(4)相关系数 具有对称性。(3)相关系数 是一个无量纲的数值,不受变量计量
3、单位的影响。(2):两个变量呈正线性相关;:两个变量呈负线性相关;:两个变量之间不存在线性关系,但有可能存在非线性关系。本质上,这里的相关系数是用来测度变量间线性关系的,因此,通常又称线性相关系数。相关分析 【例】一大型牙膏制造公司为了更好地拓展产品市场,有效地管理库存,公司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量与广告费用、销售价格、其它公司平均销售价格等之间的关系。为此,销售部门人员收集了过去30个销售周期(每个销售周期为4个星期)公司生产的牙膏销售量的相关数据。依据这些数据分析牙膏销售量与其它变量的相关关系。相关分析表 牙膏销售量的相关数据销售周期销售量/百万支 广告费用
4、/百万元销售价格/元其他公司平均销售价格/元17.385.5013.8513.80 28.516.7513.7514.0039.527.2513.7014.3047.505.5013.7013.7059.337.0013.6013.85.269.216.8013.6514.25278.276.5013.7013.65287.675.7513.7513.75297.935.8013.8013.85309.266.8013.7014.25相关分析解 绘制散点图如下:(a)销售量与广告费用(b)销售量与销售价格(c)销售量与其他公司平均销售价格正相关负相关正相关密切关系程度:(a)(c)(b)相关分
5、析解 利用收集到的牙膏销售量与广告费用数据,计算:即牙膏销售量与广告费用之间的相关系数为0.8760。同样方法,可计算得到:牙膏销售量与销售价格之间的相关系数为-0.4692,牙膏销售量与其他公司平均销售价格之间的相关系数为0.7409。相关分析解 CORREL函数、PEARSON函数都能实现返回两个变量间相关系数的功能。语法结构相同,为CORREL(array1,array2)PEARSON(array1,array2)其中,array1、array2为两变量观察数据所在区域。相关分析 图 Excel相关系数的运算结果小结1.变量间的关系2.相关关系描述 散点图3.相关关系测度 相关系数思考练习 有人曾测算得到:义务教育阶段学生的阅读能力与其脚尺寸之间的相关系数为0.91,二者的相关关系是怎样的?是否可据此推导出如下结论:脚尺寸越大的人阅读能力越好?为什么?