1、数学建模中预测方法数学建模中预测方法1/1301历届CUMCM数据预测题目n A题 SARS传输问题n年 A题 长江水质评价和预测问题n20 B题 艾滋病疗法评价及疗效 预测问题n20 A题中国人口增加预测问题n20 D题“会议筹备”对与会人数确实定n2010 B题 上海世博会影响力 相关数据预测2/1302一、预测概念一、预测概念n n系统预测:依据系统发展改变系统预测:依据系统发展改变实际实际数据数据和和历史历史资料,利用当代资料,利用当代科学科学理论和方法,理论和方法,以及各种经验、判断和知识,对事物在以及各种经验、判断和知识,对事物在未来未来一定时期内可能改变情况,进行推一定时期内可能
2、改变情况,进行推测、预计和分析。测、预计和分析。n n几个问题几个问题n n三六九,出门走。三六九,出门走。三六九,出门走。三六九,出门走。n n早霞不出门,晚霞行千里。早霞不出门,晚霞行千里。早霞不出门,晚霞行千里。早霞不出门,晚霞行千里。3/1303n n预测特点预测特点预测特点预测特点n n科学性:据统计资料和当前信息,利用一定程序、科学性:据统计资料和当前信息,利用一定程序、科学性:据统计资料和当前信息,利用一定程序、科学性:据统计资料和当前信息,利用一定程序、方法和模型,分析预测对象与相关原因相互联络,方法和模型,分析预测对象与相关原因相互联络,方法和模型,分析预测对象与相关原因相互
3、联络,方法和模型,分析预测对象与相关原因相互联络,而揭示预测对象特征和改变规律。而揭示预测对象特征和改变规律。而揭示预测对象特征和改变规律。而揭示预测对象特征和改变规律。n n近似性:受许多随机原因影响,事前预测结果,往近似性:受许多随机原因影响,事前预测结果,往近似性:受许多随机原因影响,事前预测结果,往近似性:受许多随机原因影响,事前预测结果,往往与未来实际发生结果有一定偏差。往与未来实际发生结果有一定偏差。往与未来实际发生结果有一定偏差。往与未来实际发生结果有一定偏差。n n不足:对预测对象认识常受知识、经验、观察和分不足:对预测对象认识常受知识、经验、观察和分不足:对预测对象认识常受知
4、识、经验、观察和分不足:对预测对象认识常受知识、经验、观察和分析能力限制,又掌握资料和信息不够准确完整,或析能力限制,又掌握资料和信息不够准确完整,或析能力限制,又掌握资料和信息不够准确完整,或析能力限制,又掌握资料和信息不够准确完整,或建模时简化等,造成预测分析不够全方面。建模时简化等,造成预测分析不够全方面。建模时简化等,造成预测分析不够全方面。建模时简化等,造成预测分析不够全方面。一、预测概念一、预测概念4/1304n依据预测内容:科学预测、技术预测、社会预测、经济预测、军事预测n依据预测期限:短期预测(1年内)、中期预测(25年)、长久预测(5及以上)n依据预测性质:定性预测、定量预测
5、、综合预测n n预测分类预测分类一、预测概念一、预测概念5/1305 预测技术种类繁多,据统计有预测技术种类繁多,据统计有预测技术种类繁多,据统计有预测技术种类繁多,据统计有150150各种。其各种。其各种。其各种。其中广泛采取有中广泛采取有中广泛采取有中广泛采取有15152020种。种。种。种。定性预测方法定性预测方法定性预测方法定性预测方法定量预测方法定量预测方法定量预测方法定量预测方法时间序列分析时间序列分析时间序列分析时间序列分析因果关系分析因果关系分析因果关系分析因果关系分析移动平均移动平均移动平均移动平均指数平滑指数平滑指数平滑指数平滑Box-JenkinsBox-Jenkins法
6、法法法回归分析法回归分析法回归分析法回归分析法计量经济模型计量经济模型计量经济模型计量经济模型状态空间分析状态空间分析状态空间分析状态空间分析MarkovMarkov预测预测预测预测灰色系统模型灰色系统模型灰色系统模型灰色系统模型教授会议法教授会议法教授会议法教授会议法/Delphi/Delphi法法法法主观概率法主观概率法主观概率法主观概率法领先指标法领先指标法领先指标法领先指标法神经网络预测法神经网络预测法神经网络预测法神经网络预测法一、预测概念一、预测概念6/1306预测普通步骤预测普通步骤预测普通步骤预测普通步骤一、预测概念一、预测概念7/1307二、二、时间序列分析预测法时间序列分析
7、预测法时间序列时间序列时间序列时间序列:系统中某一变量或指标数值或统计观:系统中某一变量或指标数值或统计观:系统中某一变量或指标数值或统计观:系统中某一变量或指标数值或统计观察值,按时间次序排列成一个数值序列,就称为察值,按时间次序排列成一个数值序列,就称为察值,按时间次序排列成一个数值序列,就称为察值,按时间次序排列成一个数值序列,就称为时间序列时间序列时间序列时间序列(Time Series)(Time Series),又称,又称,又称,又称动态数据动态数据动态数据动态数据。年份199019911992199319941995一季度4.776.387.4610.348.4810.39二季度
8、6.168.066.3710.458.1510.48三季度5.049.648.469.549.4312.23四季度5.136.838.898.279.6710.98某市六年来汽车货运量(亿吨公里)某市六年来汽车货运量(亿吨公里)8/1308二、二、时间序列分析预测法时间序列分析预测法 系统预测中讨论时间序列,普通是某系统预测中讨论时间序列,普通是某系统预测中讨论时间序列,普通是某系统预测中讨论时间序列,普通是某随机过随机过随机过随机过程程程程一个样本。经过对其分析研究,一个样本。经过对其分析研究,一个样本。经过对其分析研究,一个样本。经过对其分析研究,找出动态过程找出动态过程找出动态过程找出动
9、态过程特征、最正确数学模型、预计模型参数,并检验特征、最正确数学模型、预计模型参数,并检验特征、最正确数学模型、预计模型参数,并检验特征、最正确数学模型、预计模型参数,并检验利用数学模型进行统计预测精度利用数学模型进行统计预测精度利用数学模型进行统计预测精度利用数学模型进行统计预测精度,是时间序列分,是时间序列分,是时间序列分,是时间序列分析内容。析内容。析内容。析内容。年份199019911992199319941995一季度4.776.387.4610.348.4810.39二季度6.168.066.3710.458.1510.48三季度5.049.648.469.549.4312.23四
10、季度5.136.838.898.279.6710.98某市六年来汽车货运量(亿吨公里)某市六年来汽车货运量(亿吨公里)9/1309二、二、时间序列分析预测法时间序列分析预测法某某某某市市市市六六六六年年年年来来来来汽汽汽汽车车车车货货货货运运运运量量量量10/13010 时间序列特征:时间序列特征:时间序列特征:时间序列特征:n n趋势性趋势性趋势性趋势性T T:总体上连续上升或下降总改变趋势,其间变:总体上连续上升或下降总改变趋势,其间变:总体上连续上升或下降总改变趋势,其间变:总体上连续上升或下降总改变趋势,其间变动幅度可能有时不等。动幅度可能有时不等。动幅度可能有时不等。动幅度可能有时不
11、等。n n季节性季节性季节性季节性S S:以一年为周期,四个季节呈某种周期性,各:以一年为周期,四个季节呈某种周期性,各:以一年为周期,四个季节呈某种周期性,各:以一年为周期,四个季节呈某种周期性,各季节出现波峰和波谷规律类似。季节出现波峰和波谷规律类似。季节出现波峰和波谷规律类似。季节出现波峰和波谷规律类似。n n周期性周期性周期性周期性C C:决定于系统内部原因周期性改变规律,又分:决定于系统内部原因周期性改变规律,又分:决定于系统内部原因周期性改变规律,又分:决定于系统内部原因周期性改变规律,又分短周期、中周期、长周期等几个。短周期、中周期、长周期等几个。短周期、中周期、长周期等几个。短
12、周期、中周期、长周期等几个。n n不规则性不规则性不规则性不规则性I I:包含突然性和随机性变动两种。:包含突然性和随机性变动两种。:包含突然性和随机性变动两种。:包含突然性和随机性变动两种。二、二、时间序列分析预测法时间序列分析预测法 任一时间序列可表示为几个变动不一样组合总结果,任一时间序列可表示为几个变动不一样组合总结果,任一时间序列可表示为几个变动不一样组合总结果,任一时间序列可表示为几个变动不一样组合总结果,且可表示为:且可表示为:且可表示为:且可表示为:n n 加法模型:加法模型:加法模型:加法模型:Y=T+S+C+IY=T+S+C+In n 乘法模型:乘法模型:乘法模型:乘法模型
13、:Y=TSCIY=TSCI11/13011二、二、时间序列分析预测法时间序列分析预测法某市六年来汽车货运量时间序列分解某市六年来汽车货运量时间序列分解 趋势项趋势项趋势项趋势项 周期项周期项周期项周期项 随机项随机项随机项随机项12/13012n n 平滑预测法平滑预测法平滑预测法平滑预测法 包含包含包含包含移动平均法移动平均法移动平均法移动平均法和和和和指数平滑法指数平滑法指数平滑法指数平滑法两种,其详细是把时间序两种,其详细是把时间序两种,其详细是把时间序两种,其详细是把时间序列作为随机变量,利用算术平均和加权平均方法做未来趋列作为随机变量,利用算术平均和加权平均方法做未来趋列作为随机变量
14、,利用算术平均和加权平均方法做未来趋列作为随机变量,利用算术平均和加权平均方法做未来趋势预测。这么得到趋势线比实际数据点连线要平滑一些,势预测。这么得到趋势线比实际数据点连线要平滑一些,势预测。这么得到趋势线比实际数据点连线要平滑一些,势预测。这么得到趋势线比实际数据点连线要平滑一些,故称平滑预测法。故称平滑预测法。故称平滑预测法。故称平滑预测法。n n 趋势外推预测法趋势外推预测法趋势外推预测法趋势外推预测法 依据预测对象历史发展统计资料,拟合成预先指定某种依据预测对象历史发展统计资料,拟合成预先指定某种依据预测对象历史发展统计资料,拟合成预先指定某种依据预测对象历史发展统计资料,拟合成预先
15、指定某种时间函数,并用它来描述预测目标发展趋势。时间函数,并用它来描述预测目标发展趋势。时间函数,并用它来描述预测目标发展趋势。时间函数,并用它来描述预测目标发展趋势。n n 平稳时间序列预测法平稳时间序列预测法平稳时间序列预测法平稳时间序列预测法 因为平稳时间序列随机特征不随时间改变,所以可利用因为平稳时间序列随机特征不随时间改变,所以可利用因为平稳时间序列随机特征不随时间改变,所以可利用因为平稳时间序列随机特征不随时间改变,所以可利用过去数据预计该时间序列模型参数,从而能够预测未来。过去数据预计该时间序列模型参数,从而能够预测未来。过去数据预计该时间序列模型参数,从而能够预测未来。过去数据
16、预计该时间序列模型参数,从而能够预测未来。二、时间序列分析预测法二、时间序列分析预测法-分类分类13/13013二、时间序列分析预测法二、时间序列分析预测法-平稳时间序列平稳时间序列n时序图检验 依据平稳时间序列均值与方差为常数平稳时间序列均值与方差为常数性质,平稳序列时序图应该显示出该序列一直在一个常数值附近随机波动,而且波动范围有界、无显著趋势及周期特征n自相关图检验 平稳序列通常含有短期相关性平稳序列通常含有短期相关性。该性质用自相关系数来描述就是伴随延迟期数增加,平稳序列自相关系数对很快地衰减向零。n纯随机性检验(白噪声检验)平稳性检验平稳性检验14/13014nAR(p)AR(p)模
17、型模型nMA(q)MA(q)模型模型nARMAARMA(p p,q q)模型)模型 平稳时间序列分析模型:ARMA模型全称是自回归移动平均(auto regression moving average)模型,它是当前最惯用拟合平稳时间序列模型拟合平稳时间序列模型。ARMA模型又可细分为AR模型、MA模型和ARMA模型三大类。二、时间序列分析预测法二、时间序列分析预测法-平稳时间序列平稳时间序列平稳时间序列平稳时间序列15/13015n确定性时间序列分析(确定性时间序列分析(平滑法平滑法、趋势外推拟正当)趋势外推拟正当)通常这种非平稳时间序列显示出非常显著规律性,比如有显著趋势或有固定改变周期。
18、n随机性时间序列分析随机性时间序列分析(ARIMA模型模型)由随机原因造成非平稳时间序列,通常这种随机波动非常难以确定和分析。经过差分法或适当变换使非平经过差分法或适当变换使非平稳序列化成为平稳序列稳序列化成为平稳序列。在实际情况中,绝大部分序列都是非平稳,因而对非平稳序列分析更普遍、更主要,对应地各种分析方法也更多。通常包含以下两种方法:二、时间序列分析预测法二、时间序列分析预测法-非平稳序列非平稳序列n非平稳序列分析法非平稳序列分析法16/13016ARIMA(Autoregressive Integrated Moving Average)模型模型,差分自回归滑动平均模型(滑动也译作移动
19、),又称求合自回归滑动平均模型。ARIMA(p,d,q)中,AR是自回归,p为自回归项数;MA为滑动平均,q为滑动平均项数,d为使之成为平稳序列所做为使之成为平稳序列所做差分次数(阶数)差分次数(阶数)。ARIMA(p,d,q)模型是ARMA(p,q)模型扩展。二、时间序列分析预测法二、时间序列分析预测法-非平稳序列非平稳序列17/13017Box-JenkinsBox-Jenkins法法法法-时间序列分析法时间序列分析法时间序列分析法时间序列分析法18/13018例:建立国际航线旅客月度人数例:建立国际航线旅客月度人数ARIMA模型。我们已经有一组模型。我们已经有一组1949年至年至1961
20、年国际航线旅客月度人数年国际航线旅客月度人数144条统计。使用条统计。使用ARIMA过程进过程进行建模和预测。其数据列于下表所表示。行建模和预测。其数据列于下表所表示。二、时间序列分析预测法二、时间序列分析预测法实例分析实例分析YEAR12345678910111219491121181321291211351481481361191041181950115126141135125149170170158133114140195114515017816317217819919918416214616619521711801931811832182302422091911721941953196
21、196236235229243264272237211180201195420418823522723426430229325922920322919552422332672692703153643473122742372781956284277317313318374413405355306271306195731530135634835542246546740434730533619583403183623483634354915054043593103371959360342406396420472548559463407362405196041739141946147253562260
22、640846139043219/13019n(1)绘制时序图)绘制时序图二、时间序列分析预测法二、时间序列分析预测法实例分析实例分析20/13020n(2)对平稳性和季节性识别)对平稳性和季节性识别对平稳性和季节性识别通常有时序图和自相关图两种方法,或二者结合起来一起判断。l 时序图,是经过直接观察时间序列折线图来检验序列是否平稳。假如时间序列有某种趋势或展现出增加或降低范围扩散现象,则序列是不平稳。l 自相关图。假如序列折线图并不显著地展现上述现象,而我们又无法直接判断序列终究平稳是否,通常能够利用自自相关图相关图来检测序列是否平稳。二、时间序列分析预测法二、时间序列分析预测法实例分析实例分
23、析21/13021二、时间序列分析预测法二、时间序列分析预测法实例分析实例分析22/13022n(3)变换不平稳序列为平稳序列)变换不平稳序列为平稳序列l假如时间序列呈线性趋势,均值不是常数,利用一阶差分将产生一个平稳序列。l 假如时间序列呈二次趋势,均值不是常数,利用二阶差分将产生一个平稳序列。l 假如时间序列展现出随时间上升或下降而偏差,方差不是常数,通常可利用取自然对数转化为平稳序列。l 假如时间序列展现指数趋势,均值和方差都不是常数,通常也可利用取自然对数转化为平稳序列。l 假如时间序列展现“相对环”趋势,通常将数据除以同时发生时间序列对应值转化为平稳序列。二、时间序列分析预测法二、时
24、间序列分析预测法实例分析实例分析23/13023a)取对数消除振幅变大趋势-线性增加趋势二、时间序列分析预测法二、时间序列分析预测法实例分析实例分析24/13024b)需要对这个新序列数据再进行滞后一次(消除增加消除增加)和滞后12次(消除季节消除季节)共两次差分最终转换为平稳序列(4)检验待选时间序列模型自相关函数检验待选时间序列模型自相关函数二、时间序列分析预测法二、时间序列分析预测法实例分析实例分析25/13025ACF图中,我们认为自相关系数在延迟图中,我们认为自相关系数在延迟1阶后都落入阶后都落入2倍标准倍标准差内,然后在延迟差内,然后在延迟12阶处突然有一个较大自相关系数,紧阶处突
25、然有一个较大自相关系数,紧接着又落入接着又落入2倍标准差内,很象在倍标准差内,很象在1,12处截尾处截尾 26/13026n(5)预计备选时间序列模型参数预计)预计备选时间序列模型参数预计n(6)利用确定模型进行预测)利用确定模型进行预测二、时间序列分析预测法二、时间序列分析预测法实例分析实例分析27/130271 1、定义、定义、定义、定义 一元线性回归预测是处理因变量一元线性回归预测是处理因变量一元线性回归预测是处理因变量一元线性回归预测是处理因变量y y与自变量与自变量与自变量与自变量x x 之间线性关之间线性关之间线性关之间线性关系回归预测法,其数学模型为:系回归预测法,其数学模型为:
26、系回归预测法,其数学模型为:系回归预测法,其数学模型为:其中其中其中其中a a、b b称为回归系数称为回归系数称为回归系数称为回归系数 首先依据首先依据首先依据首先依据x x、y y现有统计数据,在现有统计数据,在现有统计数据,在现有统计数据,在直角坐标系中作散点图,观察直角坐标系中作散点图,观察直角坐标系中作散点图,观察直角坐标系中作散点图,观察y y随随随随x x而变是否为近似线性关系。若是,而变是否为近似线性关系。若是,而变是否为近似线性关系。若是,而变是否为近似线性关系。若是,则求出式(则求出式(则求出式(则求出式(7.4.17.4.1)中)中)中)中a a、b b值,就可值,就可值,
27、就可值,就可确定其数学模型,然后由确定其数学模型,然后由确定其数学模型,然后由确定其数学模型,然后由x x未来改变未来改变未来改变未来改变去求对应去求对应去求对应去求对应y y 值。值。值。值。三、三、回归分析预测法回归分析预测法-一元线性回归一元线性回归Y=a+bxY=a+bxy yx xa ax x0 028/13028 使拟合数值与实际值总方差为最小,即拟合程度使拟合数值与实际值总方差为最小,即拟合程度使拟合数值与实际值总方差为最小,即拟合程度使拟合数值与实际值总方差为最小,即拟合程度最好,则得二者之差最好,则得二者之差最好,则得二者之差最好,则得二者之差e ei i 依据极值原理,式(
28、依据极值原理,式(依据极值原理,式(依据极值原理,式(7.4.67.4.6)对)对)对)对a a、b b分别求偏导,分别求偏导,分别求偏导,分别求偏导,并令其并令其并令其并令其=0=0,得,得,得,得三、三、回归分析预测法回归分析预测法-一元线性回归一元线性回归2、a、b确定方法最小二乘法29/13029三、三、回归分析预测法回归分析预测法-一元线性回归一元线性回归30/13030三、三、回归分析预测法回归分析预测法-一元线性回归一元线性回归31/130313 3、回归效果检验、回归效果检验、回归效果检验、回归效果检验 y=a+bx y=a+bx一定程度上反应了一定程度上反应了一定程度上反应了
29、一定程度上反应了y y与与与与x x之间统计线性相关之间统计线性相关之间统计线性相关之间统计线性相关关系,该关系是否亲密,决定了所采取线性预测模关系,该关系是否亲密,决定了所采取线性预测模关系,该关系是否亲密,决定了所采取线性预测模关系,该关系是否亲密,决定了所采取线性预测模型多大程度上可信。这能够经过型多大程度上可信。这能够经过型多大程度上可信。这能够经过型多大程度上可信。这能够经过y y与与与与x x相关系数相关系数相关系数相关系数r rxyxy大大大大小来确定。小来确定。小来确定。小来确定。三、三、回归分析预测法回归分析预测法-一元线性回归一元线性回归32/130323 3、回归效果检验
30、、回归效果检验、回归效果检验、回归效果检验r rxyxy取值(取值(取值(取值(P136P136图图图图7-77-7):):):):n n|r rxyxy|=1|=1,样本点完全落在回归线上,样本点完全落在回归线上,样本点完全落在回归线上,样本点完全落在回归线上,y y与与与与x x有完全线性关系;有完全线性关系;有完全线性关系;有完全线性关系;n n 0 0r rxyxy11,y y与与与与x x有一定正线性相关关系,即有一定正线性相关关系,即有一定正线性相关关系,即有一定正线性相关关系,即y y伴随伴随伴随伴随x x增加而增加而增加而增加而成百分比倍数增加;成百分比倍数增加;成百分比倍数增
31、加;成百分比倍数增加;n n -1 -1r rxyxy0 表中对应数字表中对应数字表中对应数字表中对应数字r r临界值临界值临界值临界值,表示,表示,表示,表示x x、y y间存在线性相关,预间存在线性相关,预间存在线性相关,预间存在线性相关,预测模型可用。测模型可用。测模型可用。测模型可用。33/130334 4、简化算法、简化算法、简化算法、简化算法 对含有类似等差时间序列关系统计数据进行预测时,对含有类似等差时间序列关系统计数据进行预测时,对含有类似等差时间序列关系统计数据进行预测时,对含有类似等差时间序列关系统计数据进行预测时,能够采取此法。能够采取此法。能够采取此法。能够采取此法。由
32、计算由计算由计算由计算a a、b b式(式(式(式(7.4.27.4.2)、()、()、()、(7.4.37.4.3)发觉,若能使其中发觉,若能使其中发觉,若能使其中发觉,若能使其中 x xi i=0=0,则计算,则计算,则计算,则计算a a、b b就会大大简化为就会大大简化为就会大大简化为就会大大简化为三、三、回归分析预测法回归分析预测法-一元线性回归一元线性回归34/13034怎样使怎样使怎样使怎样使 x xi i=0?=0?当当当当x xi i为等差自然数列时,可引入为等差自然数列时,可引入为等差自然数列时,可引入为等差自然数列时,可引入“集中时间序列集中时间序列集中时间序列集中时间序列
33、”即即即即使等差序列呈对称形态。使等差序列呈对称形态。使等差序列呈对称形态。使等差序列呈对称形态。在给在给在给在给x xi i编号时能够这么处理:编号时能够这么处理:编号时能够这么处理:编号时能够这么处理:(1 1)若)若)若)若n n为奇数,取为奇数,取为奇数,取为奇数,取x xi i时间间隔为时间间隔为时间间隔为时间间隔为1 1,将,将,将,将x=0 x=0置于资料期置于资料期置于资料期置于资料期中央;中央;中央;中央;(2 2)若)若)若)若n n为偶数,取为偶数,取为偶数,取为偶数,取x xi i时间间隔为时间间隔为时间间隔为时间间隔为2 2,将,将,将,将x=-1x=-1(+1+1)
34、置)置)置)置于资料期中央上(下)期。于资料期中央上(下)期。于资料期中央上(下)期。于资料期中央上(下)期。例例例例7.4.1 7.4.1 某服装厂最近某服装厂最近某服装厂最近某服装厂最近5 5年服装产量以下表所表示,请预年服装产量以下表所表示,请预年服装产量以下表所表示,请预年服装产量以下表所表示,请预测该厂今明两年产量。测该厂今明两年产量。测该厂今明两年产量。测该厂今明两年产量。年份年份 倒倒5年年 倒倒4年年 倒倒3年年 前年前年 去年去年 今年今年 明年明年产量(万元)产量(万元)300 350 380 430 500?三、三、回归分析预测法回归分析预测法-一元线性回归一元线性回归法
35、法35/13035解:以年份为自变量解:以年份为自变量解:以年份为自变量解:以年份为自变量x xi i,产量为因变量,产量为因变量,产量为因变量,产量为因变量y yi i,在直角坐标系中画,在直角坐标系中画,在直角坐标系中画,在直角坐标系中画散点图后发觉散点图后发觉散点图后发觉散点图后发觉y y、x x之间基本上呈线性关系,故可用一元线性之间基本上呈线性关系,故可用一元线性之间基本上呈线性关系,故可用一元线性之间基本上呈线性关系,故可用一元线性回归方法进行预测。回归方法进行预测。回归方法进行预测。回归方法进行预测。此处此处此处此处n=5n=5为奇数,所以可列下表整理资料,并使为奇数,所以可列下
36、表整理资料,并使为奇数,所以可列下表整理资料,并使为奇数,所以可列下表整理资料,并使 x xi i=0=0年份年份倒倒5年年倒倒4年年大前年大前年前年前年去年去年 平均值平均值xi-2-10 1200 yi3003503804305001960392 xiyi-600-35004301000480Xi24101410 Yi290000122500144400184900250000791800三、三、回归分析预测法回归分析预测法-一元线性回归一元线性回归36/13036查相关系数表,此处查相关系数表,此处查相关系数表,此处查相关系数表,此处n=5n=5,若取,若取,若取,若取 =0.01=0.
37、01,置信度,置信度,置信度,置信度(1-(1-)=99%)=99%查得查得查得查得三、三、回归分析预测法回归分析预测法-一元线性回归一元线性回归37/13037 因为因为因为因为r rxyxyrr临界值临界值临界值临界值,所以,所以,所以,所以x x,y y之间确实存在着线性相关,故之间确实存在着线性相关,故之间确实存在着线性相关,故之间确实存在着线性相关,故预测模型预测模型预测模型预测模型 能够用于预测。能够用于预测。能够用于预测。能够用于预测。三、三、回归分析预测法回归分析预测法-一元线性回归一元线性回归38/130381 1、基本概念、基本概念、基本概念、基本概念 社会经济社会经济社会
38、经济社会经济S S中,影响事物发展往往是多个原因,一元回归中,影响事物发展往往是多个原因,一元回归中,影响事物发展往往是多个原因,一元回归中,影响事物发展往往是多个原因,一元回归只是一个抽象,是抓主要矛盾结果。有时分不清主次,只有只是一个抽象,是抓主要矛盾结果。有时分不清主次,只有只是一个抽象,是抓主要矛盾结果。有时分不清主次,只有只是一个抽象,是抓主要矛盾结果。有时分不清主次,只有经过多原因多元回归才能反应事物本质。经过多原因多元回归才能反应事物本质。经过多原因多元回归才能反应事物本质。经过多原因多元回归才能反应事物本质。比如一个城市公共交通营运总额比如一个城市公共交通营运总额比如一个城市公
39、共交通营运总额比如一个城市公共交通营运总额y y与该市人口总数与该市人口总数与该市人口总数与该市人口总数x x1 1、国民、国民、国民、国民生产总值生产总值生产总值生产总值x x2 2、商品流通量(或人口流动数)、商品流通量(或人口流动数)、商品流通量(或人口流动数)、商品流通量(或人口流动数)x x3 3等多原因等多原因等多原因等多原因相关,经过分析抓住主要矛盾后,可建立以下二元线性回归相关,经过分析抓住主要矛盾后,可建立以下二元线性回归相关,经过分析抓住主要矛盾后,可建立以下二元线性回归相关,经过分析抓住主要矛盾后,可建立以下二元线性回归预测模型:预测模型:预测模型:预测模型:三、三、回归
40、分析预测法回归分析预测法-多元线性回归多元线性回归39/13039 普通而言,设系统变量普通而言,设系统变量普通而言,设系统变量普通而言,设系统变量y y与与与与k k个自变量个自变量个自变量个自变量x x1 1,x,x2 2,,x xk k之间之间之间之间存在统计线性相关关系,且给定存在统计线性相关关系,且给定存在统计线性相关关系,且给定存在统计线性相关关系,且给定n n组样本数据点以下:组样本数据点以下:组样本数据点以下:组样本数据点以下:(y(y1 1,x,x1111,x,x2121,x,xk1k1),(y),(y2 2,x,x1212,x,x2222,x,xk2k2),(y),(yn
41、n,x,x1n1n,x x2n2n,x,xknkn)则其满足:则其满足:则其满足:则其满足:多元线性回归预测模型能够表示为:多元线性回归预测模型能够表示为:多元线性回归预测模型能够表示为:多元线性回归预测模型能够表示为:多元线性回归与矩阵方法相结合,是社会经济系统预多元线性回归与矩阵方法相结合,是社会经济系统预多元线性回归与矩阵方法相结合,是社会经济系统预多元线性回归与矩阵方法相结合,是社会经济系统预测与规划一个主要伎俩。测与规划一个主要伎俩。测与规划一个主要伎俩。测与规划一个主要伎俩。三、三、回归分析预测法回归分析预测法-多元线性回归多元线性回归40/130402 2、多元线性回归模型参数预
42、计、多元线性回归模型参数预计、多元线性回归模型参数预计、多元线性回归模型参数预计 设式(设式(设式(设式(7.4.107.4.10)中)中)中)中 ,则其,则其,则其,则其k+1k+1个参数个参数个参数个参数a aj j可利用可利用可利用可利用最小二乘法进行预计,记最小二乘法进行预计,记最小二乘法进行预计,记最小二乘法进行预计,记三、三、回归分析预测法回归分析预测法-多元线性回归多元线性回归41/13041于是,式(于是,式(于是,式(于是,式(7.4.107.4.10)能够表示为:)能够表示为:)能够表示为:)能够表示为:三、三、回归分析预测法回归分析预测法-多元线性回归多元线性回归42/1
43、3042 令误差平方和:令误差平方和:由极小值条件由极小值条件 可得:可得:记记 系数矩阵(对称)系数矩阵(对称)适于计算机实现适于计算机实现最小二乘法预计最小二乘法预计 是是A无偏预计。无偏预计。三、三、回归分析预测法回归分析预测法-多元线性回归多元线性回归43/13043 手算手算手算手算时,时,时,时,极小值条件能够表示为:极小值条件能够表示为:极小值条件能够表示为:极小值条件能够表示为:三、三、回归分析预测法回归分析预测法-多元线性回归多元线性回归44/13044 整理可得:整理可得:整理可得:整理可得:解上面方程组即可得到解上面方程组即可得到解上面方程组即可得到解上面方程组即可得到a
44、 a0 0,a,a1 1,a,ak k预计值。预计值。预计值。预计值。三、三、回归分析预测法回归分析预测法-多元线性回归多元线性回归45/130453 3、相关系数、相关系数、相关系数、相关系数 记记记记 RSS RSS回归平方和回归平方和回归平方和回归平方和 ESS ESS剩下平方和剩下平方和剩下平方和剩下平方和 TSS TSS总平方和总平方和总平方和总平方和三、三、回归分析预测法回归分析预测法-多元线性回归多元线性回归46/130463 3、相关系数、相关系数、相关系数、相关系数 复相关系数复相关系数复相关系数复相关系数 r r :表示:表示:表示:表示y y与全部自变量与全部自变量与全部
45、自变量与全部自变量x x1 1,x,xk k整体线性整体线性整体线性整体线性相关程度。相关程度。相关程度。相关程度。三、三、回归分析预测法回归分析预测法-多元线性回归多元线性回归47/130473 3、相关系数、相关系数、相关系数、相关系数 n n r r=1=1:y y与与与与x x1 1,x,xk k含有完全正线性相关关系,全部样本点含有完全正线性相关关系,全部样本点含有完全正线性相关关系,全部样本点含有完全正线性相关关系,全部样本点完全落在回归直线上。完全落在回归直线上。完全落在回归直线上。完全落在回归直线上。n n r r=-1=-1:y y与与与与x x1 1,x,xk k 含有完全
46、负线性相关关系,全部样本含有完全负线性相关关系,全部样本含有完全负线性相关关系,全部样本含有完全负线性相关关系,全部样本点完全落在回归直线上。点完全落在回归直线上。点完全落在回归直线上。点完全落在回归直线上。n n 0 0rr1 1:y y与与与与x x1 1,x,xk k 含有一定正线性相关关系。含有一定正线性相关关系。含有一定正线性相关关系。含有一定正线性相关关系。n n -1 -1rr0 0:y y与与与与x x1 1,x,xk k 含有一定负线性相关关系。含有一定负线性相关关系。含有一定负线性相关关系。含有一定负线性相关关系。n n r r=0=0:y y与与与与x x1 1,x,xk
47、 k 之间不存在线性相关关系。之间不存在线性相关关系。之间不存在线性相关关系。之间不存在线性相关关系。对一元线性回归而言,相关系数含义见对一元线性回归而言,相关系数含义见对一元线性回归而言,相关系数含义见对一元线性回归而言,相关系数含义见P136P136图图图图7-7.7-7.三、三、回归分析预测法回归分析预测法-多元线性回归多元线性回归48/130484 4、回归模型统计检验、回归模型统计检验、回归模型统计检验、回归模型统计检验 (1 1)标准离差检验:用于检验回归模型精度。)标准离差检验:用于检验回归模型精度。)标准离差检验:用于检验回归模型精度。)标准离差检验:用于检验回归模型精度。(2
48、 2)相关系数检验:用复相关系数检验整体线性相关关系是)相关系数检验:用复相关系数检验整体线性相关关系是)相关系数检验:用复相关系数检验整体线性相关关系是)相关系数检验:用复相关系数检验整体线性相关关系是 否可信。否可信。否可信。否可信。r=1 r=1:完全线性相关(全部点均在拟合直线上);:完全线性相关(全部点均在拟合直线上);:完全线性相关(全部点均在拟合直线上);:完全线性相关(全部点均在拟合直线上);r=0 r=0:不相关。:不相关。:不相关。:不相关。假如假如假如假如r r在某个显著性水平在某个显著性水平在某个显著性水平在某个显著性水平 下超出了下超出了下超出了下超出了r r临界值临
49、界值临界值临界值(附表二),则(附表二),则(附表二),则(附表二),则认为认为认为认为r r在显著性水平在显著性水平在显著性水平在显著性水平 下与下与下与下与0 0显著不一样,检验经过。显著不一样,检验经过。显著不一样,检验经过。显著不一样,检验经过。反应预计值和样本值反应预计值和样本值反应预计值和样本值反应预计值和样本值平均误差,要求:平均误差,要求:平均误差,要求:平均误差,要求:三、三、回归分析预测法回归分析预测法-多元线性回归多元线性回归49/130494 4、回归模型统计检验、回归模型统计检验、回归模型统计检验、回归模型统计检验 (3 3)回归方程显著性检验(回归方程显著性检验(回
50、归方程显著性检验(回归方程显著性检验(F F检验)检验)检验)检验):在一定显著性水平:在一定显著性水平:在一定显著性水平:在一定显著性水平 下,检验假设下,检验假设下,检验假设下,检验假设a ai i=0(i=1,k)=0(i=1,k)是否成立。是否成立。是否成立。是否成立。结构统计量结构统计量结构统计量结构统计量F:F:则当则当则当则当时否定假设,认为在显著性水平时否定假设,认为在显著性水平时否定假设,认为在显著性水平时否定假设,认为在显著性水平 下,回归模型有意义下,回归模型有意义下,回归模型有意义下,回归模型有意义(查附表四)。(查附表四)。(查附表四)。(查附表四)。三、三、回归分析