收藏 分享(赏)

仿真计算在数理统计中的应用.pdf

上传人:爱文献爱资料 文档编号:21754713 上传时间:2024-04-21 格式:PDF 页数:12 大小:5.35MB
下载 相关 举报
仿真计算在数理统计中的应用.pdf_第1页
第1页 / 共12页
仿真计算在数理统计中的应用.pdf_第2页
第2页 / 共12页
仿真计算在数理统计中的应用.pdf_第3页
第3页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、Pure Mathematics 理论数学理论数学,2023,13(10),2888-2899 Published Online October 2023 in Hans.https:/www.hanspub.org/journal/pm https:/doi.org/10.12677/pm.2023.1310295 文章引用文章引用:张东,安玉娥,王娟.仿真计算在数理统计中的应用J.理论数学,2023,13(10):2888-2899.DOI:10.12677/pm.2023.1310295 仿真计算在数理统计中的应用仿真计算在数理统计中的应用 张张 东东1,安玉娥,安玉娥2*,王,王 娟娟

2、1 1上海理工大学理学院,上海 2上海立信会计金融学院统计与数学学院,上海 收稿日期:2023年9月9日;录用日期:2023年10月10日;发布日期:2023年10月18日 摘摘 要要 随着新时期学科融合的大趋势,结合数理统计课程的定位与特点,将仿真计算引入课堂教学过程。结合随着新时期学科融合的大趋势,结合数理统计课程的定位与特点,将仿真计算引入课堂教学过程。结合Matlab仿真计算软件,针对数理统计中的经典问题,如抽样计算、统计推断、分布拟合、回归分析等内仿真计算软件,针对数理统计中的经典问题,如抽样计算、统计推断、分布拟合、回归分析等内容进行计算机模拟仿真计算,突出学科融合与内容契合,以期

3、达到理论与实际相结合,更深刻理解概念、容进行计算机模拟仿真计算,突出学科融合与内容契合,以期达到理论与实际相结合,更深刻理解概念、方便科学应用的目的。通过仿真计算结果的具体呈现,将数理统计学习中的理论知识结果通过模拟方便科学应用的目的。通过仿真计算结果的具体呈现,将数理统计学习中的理论知识结果通过模拟仿真运算更直观生动的展示出来,在略显理论化的数学课堂中增加了图像展示,使得学习者更加容易接仿真运算更直观生动的展示出来,在略显理论化的数学课堂中增加了图像展示,使得学习者更加容易接受知识系统并反过来进一步增强对本门课程及后续课程的兴趣受知识系统并反过来进一步增强对本门课程及后续课程的兴趣。文中还对

4、引入仿真计算后的课程设置给。文中还对引入仿真计算后的课程设置给出了教学建议出了教学建议。关键词关键词 仿真计算仿真计算,数理统计数理统计,数学软件数学软件,数值实验数值实验,随机数随机数 Application of Simulation Computing in Mathematical Statistics Dong Zhang1,Yue An2*,Juan Wang1 1College of Science,University of Shanghai for Science and Technology,Shanghai 2College of Statistics and Mathe

5、matics,Shanghai Lixin University of Accounting and Finance,Shanghai Received:Sep.9th,2023;accepted:Oct.10th,2023;published:Oct.18th,2023 Abstract With the general trend of discipline integration in the new era,combined with the positioning and *通讯作者。张东 等 DOI:10.12677/pm.2023.1310295 2889 理论数学 charac

6、teristics of mathematical statistics courses,simulation computing is introduced into the classroom teaching process.Combined with Matlab simulation and calculation software,computer simulation simulation calculations are carried out for classic problems in mathematical statistics,such as sampling ca

7、lculation,statistical inference,distribution fitting,regression analysis,etc.,highlighting the integration of disciplines and content fit,in order to achieve the purpose of com-bining theory and practice,understanding concepts more deeply and facilitating scientific appli-cations.Through the specifi

8、c presentation of simulation calculation results,the theoretical know-ledge results in the learning of“Mathematical Statistics”are displayed more intuitively and vividly through simulation operations,and image display is added in the slightly theoretical mathematics classroom,so that learners are mo

9、re receptive to the knowledge system and in turn further en-hance their interest in this course and subsequent courses.In this paper,teaching suggestions are also given for the curriculum after the introduction of simulation calculation.Keywords Simulation Calculations,Mathematical Statistics,Mathem

10、atical Software,Numerical Experiments,Random Numbers Copyright 2023 by author(s)and Hans Publishers Inc.This work is licensed under the Creative Commons Attribution International License(CC BY 4.0).http:/creativecommons.org/licenses/by/4.0/1.引言引言 数理统计思想起源于十九世纪以前的描述性统计,后来经过近代经典统计学和现代推断统计学的发展逐步发展为一门理论

11、充实、应用广泛的学科1 2 3 4。数理统计作为统计学学生的重要专业基础课及数学与应用数学专业学生的一门核心基础课对学生应用数学思想的培养起着举足轻重的作用。现如今,概率统计在各行各业开枝散叶,发挥着它的理论指导、数据发掘及统计决策作用,数理统计的思想方法越来越被各行业所接受5 6。随着国务院学位委员会、教育部联合印发的国务院学位委员会、教育部关于设置“交叉学科”门类、“集成电路科学工程”和“国家安全学”一级学科的通知出炉7,跨学科与交叉学科理念逐渐成为当前高等教育的热门话题与选择。基于此,在数理统计与数据处理高融合的前提下,计算机软件的仿真计算被大量的应用在本学科的教学中。本文以常用的仿真计

12、算软件 Matlab 为载体,结合数理统计中的经典理论如抽样分布、统计推断、回归分析等内容进行模拟演示6 8,使整个教学过程更加自然、和谐。Matlab 的全称是“Matrix Laboratory”,译为矩阵实验室,在处理矩阵、向量等高维数据及高精度模拟、仿真等方面拥有强大的运算处理能力9。基于仿真计算在各行各业中大量的应用及带来的便利,作为应用性很强的数理统计课程也必然会从仿真计算的应用中获益。固然课程中的概率思想及数学分析理论推导过程是必不可少的,但也不可避免会带来知识的固化与学习者的困惑:我们需要这些理论知识,但我们也需要更加生动直观的呈现出来。经过作者多年的教学实践,作为一款功能强大

13、的科学计算与仿真软件,Matlab 在数理统计的教学过程中可以方便的呈现这些问题,并通过多年的教学比对发现学生在大量应用仿真软件后比以前能更好的消化、理解经典的数理统计思想,对重要知识点的认识有了很大的改变,对学习也产生了更加浓厚的兴趣,取得了更好的学习效果。Open AccessOpen Access张东 等 DOI:10.12677/pm.2023.1310295 2890 理论数学 2.仿真计算在抽样分析中的应用仿真计算在抽样分析中的应用 经典的数理统计教材中基于各种原因很少出现仿真软件的结合,然而实践下来却发现,适当的仿真软件的应用必不可少。众所周知,数理统计教材附表中的分位数表,提供

14、了标准正态分布、学生氏分布、卡方分布、Fisher 分布、W 检验等分位数表,但无一例外这些分位数表也只能在有限的篇幅中选用一些特殊的值,如0.05,0.90,0.95,=等,显然这样的设计限制了抽样概率、置信区间或显著性检验中的概率的应用,使得问题变得不易处理。下面通过几个例子来对此问题进行阐释与解决。案例案例 1 2:在“正态总体抽样分布”这一环节的学习过程中,经常会遇到研究某统计量取值区间的概率计算问题。这类问题比较常见的是基于易查分位数的概率计算,如()()71.4412 1 0.90.8xPs=,这是很简单的计算,因为基于()0.91.4471t=的查表事实。但是分位数表总归是有限的

15、,离散的,并不能提供统计量在每一个区间中的概率计算。比如从总体()2,N 中抽取容量为 20 的样本1220,x xx,求概率()()2202211020iiPX=,则转化为()()()()()()2221020.2020.2020.10Pr vPr vPr v=,显然 20 与 10 这两个分位数无法查表,考虑到卡方分布的连续性,可以进行一次线性插值做近似计算,这种方法除了近似度不高以外,计算的复杂度也较大,此时可以应用 Matlab 语言,chi2cdf(20,20)-chi2cdf(10,20)Ans=0.5102 也即顺利得到:()()21020.200.5102Pr v=,类似也可以

16、参考下面案例 2。案例案例 2 2:从()2,N 中抽取容量为 16 的样本1216,x xx,样本方差26.53s=,求样本均值与总体均值的距离在 0.1 至 0.5 之间的概率,即求概率()0.10.5Px,则转化为()()()()0.10.515.415.0.8161616xPP tr vP tr vsss=。Matlab 语言为:tcdf(4,15)-tcdf(0.8,15)Ans=0.2175 从而有:()0.10.50.2175Px=。3.仿真计算在随机模拟与分布拟合中的应用仿真计算在随机模拟与分布拟合中的应用 问题问题 1:计算机随机模拟以显示不同的参数取值对分布密度曲线的影响:

17、计算机随机模拟以显示不同的参数取值对分布密度曲线的影响 在五大抽样分布“伽马分布、贝塔分布、卡方分布、学生氏分布、F 分布”的内容学习中,经典的教材会通过数学分析的推导过程,如通过微分的方法运用一阶、二阶导数讨论密度函数的单调性、峰值点(众数)、凹凸性等常见的函数性质,这些分析方法从知识系统的严谨性上当然是不可少的(当然要耗费大量的课时,可以根据各校课时情况有选择的在课堂中加以体现),但是真实的分布形态是否正如理论推导的那样呈现这种规律性呢?Matlab 仿真软件提供了通过产生随机数来画出概率密度函数的方法,作为知识体系的有益补充,可以拿来所用。案例案例 3:通过 Matlab 仿真探讨伽马分

18、布 Gamma(,)3的密度函数图像随着形状参数 改变而改变的规律。(分别取1,2,4=,0.6=)Matlab 语言为:x=0:0.01:8;y1=gampdf(x,1,0.6);y2=gampdf(x,2,0.6);y3=gampdf(x,4,0.6);张东 等 DOI:10.12677/pm.2023.1310295 2891 理论数学 plot(x,y1,.b,x,y2,.g,x,y3,.k);title(Gamma 分布不同形参的密度函数图像);legend(Gamma(1,0.6),Gamma(2,0.6),Gamma(4,0.6);分析分析图像如图 1 所示,从实验仿真的角度验证

19、了:当1时 f 递减(1=即为指数分布);当(1,2 时,f 先上凸后下凸;当()2,+时,f 先下凸再上凸后下凸。由于1Gamma,2 2n即为()2n分布,从而当自由度 n 4 时,即与()2,+时伽玛分布的图像类似。Figure 1.Density function of Gamma 图图 1.Gamma 分布密度函数曲线 案例案例 4:Beta(a,b)3的密度函数图像随着参数 a,b 的改变而改变的规律(分别取 a=b=0.5;a=2,b=3;a=0.5,b=2;a=2,b=0.5;a=1,b=2;a=2,b=1)。Matlab 语言为:x=0:0.001:1;y1=betapdf(

20、x,0.5,0.5);y2=betapdf(x,2,3);y3=betapdf(x,0.5,2);y4=betapdf(x,2,0.5);y5=betapdf(x,1,2);y1=betapdf(x,2,1)plot(x,y1,.b,x,y2,.g);legend(Beta(0.5,0.5)a1 b1 b1);title(Beta 分布不同形参的密度函数图像 a1 b1 b1);ylim(0 10);分析分析可得 Beta(0.5,0.5)与 Beta(2,3)的密度函数在同一个坐标系中的图像如图 2 所示,一定程度上也反映了当参数 a 1,b 1,b 1 时贝塔分布的图像成上下对偶排列。类似

21、也可得当参数 a 1 时贝塔分布的图像与 a 1,b 1 时贝塔分布的图像与 a 1,b=1 时贝塔分布的图像成上下对偶排列(图 4)。案例案例 5:(),F m n 1 2 3分布的密度函数图像随着双自由度的改变而改变(分别取 m=10,n=5;m=10,n=25)。Matlab 语言为:x=0:0.001:12;y1=fpdf(x,10,5);y2=fpdf(x,10,25);plot(x,y1,.r,x,y2,.b);legend(F(10,5),F(10,25);title(F 分布双自由度对密度函数的影响)图像如图 5 所示。随着第二自由度的增大,图像呈现更高的峰及更细的尾部。张东

22、等 DOI:10.12677/pm.2023.1310295 2892 理论数学 Figure 2.Density function curve of Beta 图图 2.Beta 分布密度函数曲线 Figure 3.Density function curve of Beta 图图 3.Beta 分布密度函数曲线 Figure 4.Density function curve of Beta 图图 4.Beta 分布密度函数曲线 张东 等 DOI:10.12677/pm.2023.1310295 2893 理论数学 Figure 5.Density function of F 图图 5.F

23、分布密度函数曲线 案例案例 6:()2,N 分布的密度函数随方差2的变化而呈尖峰值或厚尾性(分别取 =1,=5,=10,=3)。Matlab 语言为:x=-20:0.01:20;y1=normpdf(x,3,1);y2=normpdf(x,3,25);y3=normpdf(x,3,100);plot(x,y1,.r,x,y2,.b,x,y3,.k);legend(N(3,1),N(3,25),N(3,100);ylim(0 0.6);title(正态分布图像受不同方差的影响效果)分析分析图像如图 6 所示。从中不难发现,越小,正态取值越集中于 附近,图像的峰越尖,尾部越细;反之,越大,正态取值

24、越分散于 的两边,图像的峰越缓,尾部越厚,也即发生异常值的概率越大,在金融风险中预示着投资的风险越大,但获得超高收益或超低收益的概率也越大。Figure 6.Influence of different variance to N 图图 6.不同方差对正态分布的影响 张东 等 DOI:10.12677/pm.2023.1310295 2894 理论数学 问题问题 2:对已有样本数据的适当分布拟合:对已有样本数据的适当分布拟合 大多数数学系或概率统计系所授数理统计课程中,最核心的知识内容就是统计推断,也就是根据已有的样本数据,基于参数估计、假设检验、分布拟合等方法对数据进行加工处理与信息挖掘,以

25、期发现一定的统计规律,为以后的工作生活提供适当的决策指导。比如对教师工作来说,教学方法是否科学,学生接受程度是否理想,试卷题目内容及分值分配是否科学合理等,其实通过考试成绩这个样本数据可以一定程度上反映出来。案例案例 7:试对某学期某班的数理统计课程的期末考试成绩做分布拟合。x=78 84 81 97 71 80 68 84;共 64 个样本数据 normplot(x);histfit(x);skewness(x)kurtosis(x);mean(x)median(x)std(x);Figure 7.Normal probability plot 图图 7.正态概率图 Figure 8.His

26、togram 图图 8.直方图 张东 等 DOI:10.12677/pm.2023.1310295 2895 理论数学 Figure 9.One-sample K-S test 图图 9.单样本 K-S 检验 分析分析正态 QQ 图 7 显示分数数据基本服从正态分布;直方图拟合图 8 也显示数据与正态钟形曲线初步拟合;K-S 非参检验(SPSS 结果图 9)显示 p-value=0.760 0.05,定性分析考试分数服从正态分布。偏度 Skewness=0.6013(轻微左偏),峰度 kurtosis=3.1684 3=正态分布的峰度,()()()mean xmedian xstd x79.8

27、28180.500012.0890=,即平均分 79.8281,中位分数 80.500,标准差 12.089。可认为本次考试成绩服从正态分布()279.8281,12.089N。从中可以得到 79.8 分的卷面均分及 12 分的标准差说明学生基本可以掌握 80%的学习内容,且标准差在 15 分以下,同学之间的差距并没有太大,也反映了在本学期本门课程的学习中,大多数同学能跟得上教师的教学进度与难度,且成绩拥有较好的正态性。4.仿真计算在经典统计推断中的应用仿真计算在经典统计推断中的应用 统计推断主要有参数估计、假设检验(含分布拟合检验)等内容,一直以来都是学习数理统计的重点及难点。传统的课堂学习

28、注重理论传授与统计思想的点播,如在矩法估计中会介绍 Pearson 的替换原则,MLE 中会介绍高斯和 Fisher 的似然函数思想,区间估计中会围绕枢轴量展开学习,假设检验中会引入实际推断原理(概率意义下的反证法)等等。这些都是优秀的理论思想,如何将这些好的理论更好地呈现在课堂上,高效的仿真计算软件就非常有用了。案例案例 8:通过构造两个正态随机向量,并比较它们的均值是否相等?并给出总体均值之差的 95%置信区间(分别产生两个 100 维的()0,2N及()0.5,2N随机向量,做假设检验012112:HH=,并给出12的 95%置信区间)9。Matlab 语言为:x=normrnd(0,2

29、,100,1);y=normrnd(0.5,2,100,1);h,sig,ci=ttest2(x,y);z=x,y;boxplot(z)plot(sort(x),normpdf(sort(x),+r,sort(y),normpdf(sort(y),.k)分析分析 h=0(接受原假设);p-value=0.7245 0.05 不显著,不拒绝原假设;12的 95%置信区间为0.7145,0.4976含有 0 点,故不拒绝012:H=的原假设。箱线图如图 10 所示,显示两总体均值无显著区别。两随机向量的密度函数图如图 11 所示,两组数据的正态值基本同步拟合,且正态性较好。张东 等 DOI:10.

30、12677/pm.2023.1310295 2896 理论数学 Figure 10.Box plot 图图 10.箱线图 Figure 11.Fit of normal curve 图图 11.正态曲线拟合 案例案例 9:对 12 名女子的身高(x:cm)与腿长(y:cm)数据:Table 1.Sample data of height and leg length 表表 1.身高与腿长的样本数据 身高 149 150 153 154 155 156 157 158 160 162 163 164 腿长 92 93 93 95 96 98 97 96 98 99 100 102 试结合表 1

31、的样本数据对身高与腿长变量做一元线性回归分析。散点图 x=149 150 153 154 155 156 157 158 159 160 162 164;y=92 93 93 95 96 98 97 96 98 99 100 102;plot(x,y,.r);corr(x,y)建立回归模型 x=ones(12,1)x;张东 等 DOI:10.12677/pm.2023.1310295 2897 理论数学 b,bint,r,rint,stats=regress(y,x);mean(r)var(r)分析分析散点图 12 表明身高与腿长具有明显的线性关系,相关系数 r=0.9587 强相关;回归直线

32、方程为3.42450.6394yx=+,回归直线与散点图的同框如图 13 所示;线性模型01yx=+中,参数0与1的 95%置信区间分别为24.3257,17.4767与0.5058,0.7729;每个观测点与回归方程的残差结果分别为 0.1586,0.5193,1.3988,0.0382,0.3224,1.6831,0.0437,1.5957,0.2350,0.1256,0.1531,0.5681;stats0.9192 113.7486 0.0000 0.8155=的结果表明回归的20.91921R=,模型检验的 F-value=113.7486,检验的 p-value=0 模型高度显著;

33、误差方差20.8155=;而对残差序列 r 来说()0E r=,()20.8610Var r=,r的的正态Q-Q图如图14所示,残差序列的K-S正态性检验如图15所示,p-value=0.573,接受故残差为正态分布,从而线性回归模型拟合为:()23.42450.6394,0,0.8610yxN=+基于这个线性回归模型则可以对成年女性身高与腿长的大致关系进行计算,如身高 170 cm 的女性,其腿长大约为3.4245+0.6394 170=105.27 cm。Figure 12.Scatter 图图 12.散点图 Figure 13.Scatter and regressive line 图图

34、 13.散点图与回归直线 张东 等 DOI:10.12677/pm.2023.1310295 2898 理论数学 Figure 14.Normal QQ of residual 图图 14.残差的正态 QQ 图 Figure 15.One-sample K-S test 图图 15.单样本 K-S 检验 5.仿真计算引入课堂后的课程计划建议仿真计算引入课堂后的课程计划建议 以笔者所在院系数理统计课程 48 学时的情况来看,正常的知识理论讲授及习题训练可以安排40 学时,教师仿真计算案例演示可以占用 4 学时(因为是课堂穿插,所以是估计),学生上机实验 4 学时,当然这 4 学时也可以以课后家庭

35、作业的形式进行,毕竟在总学时数不宽裕的情况下,每一学时都是宝贵的。如果有软件类或科学计算类课程设置的话,完全可以在此课程中加入“数理统计”或“统计推断”模块,辅以科学的考核方式,会达到更好的学习效果。当然所有这些呈现都需要学校平台基本的资源配备,如多媒体教室、学生机房、正版软件等加持,相信所有这些随着国家对教育投资的加大及不同院校校内资源的合理规划是可以实现的。6.总结总结 本文阐述了仿真计算在数理统计中经典的抽样分析、随机模拟、统计推断(区间估计、假设检验、回归分析)中的应用方法。作为数学专业的同学来说,掌握扎实的理论基础固然重要,结合各种数学软件熟练的处理各种实际问题也必不可少。文章选用了

36、 Matlab 仿真计算软件作为载体,当然老师们可以根据自己的习惯选用适合自己的、学生易于接受的仿真软件进行辅助教学工作。比如在多元统计分析中常张东 等 DOI:10.12677/pm.2023.1310295 2899 理论数学 用 SPSS 或 SAS 统计软件做分类分析(聚类分析与判别分析)、降维分析(主成分分析与因子分析),在时间序列分析 中常结合 Eviews 软件做线性时间序列 B-J 模型和异方差 ARCH 类模型等。适当的模拟仿真及科学计算对数理统计等应用类学科的学习可以起到画龙点睛的作用,也可以在学习过程中起到润滑的作用,帮助学习者提高学习兴趣以及更灵活的进行数据处理。感谢文

37、中所有参考文献作者所做的卓越工作。基金项目基金项目 上海理工大学教师发展研究项目(CFTD2023YB40)。参考文献参考文献 1 魏宗舒.概率论与数理统计教程M.第三版.北京:高等教育出版社,2008.2 茆诗松,程依明,濮晓龙.概率论与数理统计教程M.第三版.北京:高等教育出版社,2019.3 叶慈南,曹伟丽.应用数理统计M.北京:机械工业出版社,2004.4 盛骤,谢式千,潘承毅.概率论与数理统计M.第五版.北京:高等教育出版社,2019.5 唐琳.大数据背景下“数理统计”课程的教学改革研究J.云南大学学报,2020,42(S1):61-64.6 章美月.基于 Mathematica 的概率论与数理统计课程教学改革探索与实践J.大学数学,2020,36(5):49-56.7 国务院学位委员会关于印发交叉学科设置与管理办法(试行)的通知EB/OL.https:/ 侯臣平,娇媛媛.Matlab 在概率论与数理统计教学中的应用J.教育教学论坛,2019(5):156-157.9 李涛,贺勇军,刘志俭.Matlab 工具箱应用指南应用数学篇M.北京:电子工业出版社,2000.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 综合论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报