医学统计学实习指导(临本)2017-9.2 - 用于合并.pdf

资源描述

1、1 医学统计学实习指导医学统计学实习指导（供医学本科用）（供医学本科用）右江民族医学院右江民族医学院统计教研室编统计教研室编 2014 年年 8 月月 2 前言本实习指导融合了全国多所高等医科院校多年来医学统计学实习指导改革的成果，汲取了国内外先进教材的经验，我们在总结了多年的医学统计学实践教学经验的基础上编写了这本教材。内容实用，可操作性强。本书可供临床医学本科、检验医学本科、影像医学本科等医学专业的学生使用，也可供从事医学统计学实验教学的教师参考。本实验教材分为 6 个章节；内容涉及 SPSS 简介、数据文件的建立、保存、统计描述、t 检验、2检验、秩和检验和直线相关与

2、回归等内容。为了培养学生灵活运用所学理论及实验知识独立分析和解决问题的能力，实习指导按照例题和联系相结合的模式，使学生对所学的医学统计学知识有更深刻的理解，提高实验的实践操作技能，提高学生学习的主观能动性。在学生实验训练中，一定要强调做好预习，阅读教材，加强主动性。实验教材的使用过程中可根据教学实际选择不同的例题和课后练习进行教学。参加本次实验教材的修订工作的有右江民族医学院预防教研室的陆贤杰、马迎教、邓树嵩、郭蕊、李阳、周泽文，特别是马迎教教授和邓树嵩副教授在本书的编写中做出了很多实质性工作并提出了很多有建设性的建议，这些工作和建议弥补了很多编写过程中的不足，大大完善了书中内容，在此向他

3、们深表感谢。由于编者水平有限，书中难免有不妥之处，望广大师生希望对书中不妥和错误之处批评指正。编者二 0 一四年八月 3 目目录录实验一实验一 SPSSSPSS 简介、数据文件的建立、保存简介、数据文件的建立、保存4 4 实验二实验二统计描述统计描述12 12 实验三实验三 t t 检验检验 26 26 实验四实验四 2检验检验36 36 实验五实验五秩和检验秩和检验4646 实验六实验六直线相关与回归直线相关与回归6 64 4 4 实验实验一一 SPSS 简介、数据文件的建立、保存简介、数据文件的建立、保存 SPSS（Statistics Package for Social

4、 Science）for Windows 是在 Windows 系统下运行的社会科学统计软件包。SPSS 兼容性好，可以从几乎任何类型的文件中获取数据，然后使用这些数据生成分布和趋势、进行统计描述及统计推断；SPPS 界面友好，使用菜单式操作 Windows 的窗口方式进行数据管理，采用菜单式操作进行数据分析；SPSS 功能强大、包含了绝大部分的统计分析方法，是非统计学专业人员学习、使用统计方法的好工具。 SPSS 自 20 世纪 60 年代诞生以来，为适应各种操作系统平台的要求经历了多次版本更新，各种版本的 SPSS for Windows 大同小异，在本试验课中我们选择 SPSS 13.

5、0 为例进行讲解。一、一、SPSS 的启动的启动在 windows 中选择开始所有程序SPSS for WindowsSPSS 13.0 for Windows即可启动 SPSS 软件，进入 SPSS for Windows 对话框，如图 1.1，图 1.2 所示。图 1.2 中对话框包括一个六选一单选对话框和一个复选对话框，其内容为：图 1.1 SPSS 启动 Run the tutorial 运行操作指南； Type in data 输入数据选项，建立新的数据集时可选择此项； Run an existing query 运行一个已经存在的数据文件选项； Create new quer

6、y using Database Wizard 用数据库处理工具建立新文件； Open an existing date source 打开一个已经存在的数据文件； Open another type of file 打开其他类型的文件。 Dont show this dialog in the future 是一复选对话框，选中该复选项后，下次启动 SPSS5 时将不会显示对话框，直接显示数据编辑窗口。图图 1.2 SPSS 启动启动对话框对话框二、二、SPSS 软件的退出软件的退出 SPSS 软件的退出方法与其他 Windows 应用程序相同，有两种常用的退出方法：（1）按 File

7、Exist 的顺序使用菜单命令退出程序。（2）直接单击 SPSS 窗口右上角的“关闭”按钮，回答系统提出的是否存盘的问题之后即可安全退出程序。三、三、SPSS 的主要窗口的主要窗口简介简介 SPSS 软件运行过程中会出现多个界面，各个界面用处不同。其中，最主要的界面有：6 数据编辑窗口、结果输出窗口。（一）数据编辑窗口启动 SPSS 后看到的第一个窗口便是数据编辑窗口，如图 1.3 所示。在数据编辑窗口中可以进行数据的录入、编辑以及变量属性的定义和编辑，数据编辑窗口与微软的 Excel类似，但 SPSS 的统计功能更多。SPSS 的结果输出窗口是显示统计分析的结果，此窗口

8、的内容可以以结果文件.spo 的形式保存。数据编辑窗口和结果输出窗口的详细描述将在有关 SPSS 的数据文件建立的内容中查到。主要由以下几部分构成：标题栏、菜单栏、工具栏、编辑栏、变量名栏、观测序号、窗口切换标签、状态栏。SPSS 对一些基本模块中的统计提供了帮助，可以通过单击 Help 菜单中的 Statistics Coach 命令，选择所需要的帮助。图图 1.3 数据浏览界面数据浏览界面标题栏：显示数据编辑的数据文件名。菜单栏：由 10 个菜单项目组成的主菜单，通过对这些菜单的选择，用户可以进行几乎所有的 SPSS 操作。主要内容有：菜单栏工具栏编辑栏观测序号变量名栏窗

9、口切换标签状态栏标题栏 7 File：文件操作。 Edit：文件编辑。 View：视图编辑。 Data：数据操作。 Transform：数据转换。 Analyze：统计分析方法。 Graphs：图形编辑。 8.Utilities：实用程序。 Windows：窗口控制。 Help：帮助。工具栏：为了方便用户操作，SPSS 软件把菜单项中常用的命令放到了工具栏里。当鼠标停留在某个工具栏按钮上时，会自动跳出一个文本框，提示当前按钮的功能。另外，如果用户对系统预设的工具栏设置不满意，也可以用 ViewToolbars 对工具栏按钮进行定。编辑栏：可以输入数据，以使它显示在内容区指定的方格里。

10、变量名栏：列出了数据文件中所包含变量的变量名观测序号：列出了数据文件中的所有观测值。观测的个数通常与样本容量的大小一致。窗口切换标签：用于“Data view” （数据视图）和“variable view” （变量视图）的切换。即数据浏览窗口与变量浏览窗口。 Data View 表可以直接输入观测数据值或存放数据，表的左端列边框显示观测个体的序号，最上端行边框显示变量名。 Variable View 表用来定义和修改变量的名称、类型及其他属性，如图 1.4 所示。 8 图图 1.4 Variable View 表表在 Variable View 表中，每一行描述一个变量，依次是： N

11、ame：变量名。变量名必须以字母、汉字及开头，总长度不超过 8 个字符，共容纳 4 个汉字或 8 个英文字母，英文字母不区别大小写，最后一个字符不能是句号。 Type：变量类型。变量类型有 8 种，最常用的是 Numeric 数值型变量。其它常用的类型有：String 字符型，Date 日期型,Comma 逗号型（隔 3 位数加一个逗号）等。 Width：变量所占的宽度。 Decimals：小数点后位数。 Label：变量标签。关于变量涵义的详细说明。 Values：变量值标签。关于变量各个取值的涵义说明。 Missing：缺失值的处理方式。 Columns：变量在 Date View 中所显

12、示的列宽（默认列宽为 8）。 Align：数据对齐格式（默认为右对齐）。 Measure：数据的测度方式。系统给出名义尺度、定序尺度和等间距尺度三种（默认9 为等间距尺度）。如果输入变量名后回车，将给出变量的默认属性。如果不定义变量的属性，直接输入数据，系统将默认变量 Var00001,Var00002 等。定义了变量的各种属性后，回到 Data View 表中，就可以直接在表中录入数据。输入数据后可以点击 Save 或 Save as 作为数据文件保存。另外对于统计分析的结果也可以作为文件保存起来。为了在统计分析过程中能有效的利用其它软件产生的数据， SPSS 软件编辑窗口除可以

13、使用*.sav 扩展名数据文件，还可以直接打开和保存下述类型的文件。 SPSS DOS 版本产生的数据文件*.sys； Excel 报表程序产生的数据文件*.xls； DBASE 数据库格式文件*.dbf； SAS 统计软件产生的数据文件*.sd2。状态栏：用于说明显示 SPSS 当前的运行状态。SPSS 被打开时，将会显示“SPSS Processor is ready”的提示信息。（二二）结果输出窗口）结果输出窗口在 SPSS 中大多数统计分析结果都将以表和图的形式在结果观察窗口中显示。窗口右边部分显示统计分析结果，左边是导航窗口，用来显示输出结果的目录，可以通过单击目录来展开右边窗

14、口中的统计分析结果。当用户对数据进行某项统计分析，结果输出窗口将被自动调出。当然，用户也可以通过双击后缀名为.spo 的 SPSS 输出结果文件来打开该窗口。四、四、数据的建立数据的建立和和保存保存（一）创建一个数据文件 1选择菜单 FileNewData 新建一个数据文件，进入数据编辑窗口。 2单击左下角 Variable View 标签进入变量视图界面，根据试验的设计定义每个变量类型。 3变量定义完成以后，单击 Data View 标签进入数据视窗界面，将每个具体的变量10 值录入数据库单元格内。（二）读取外部数据以 Excel 文件为例，选择菜单 FileOpenData 调出打

15、开数据对话框，在文件类型下拉列表中选择数据文件类型，选择要打开的 Excel（也可以是其他类型的文件）文件，单击“打开”按钮，调出打开 Excel 数据源对话框，如图 1.5 所示，单击 OK。图图 1 1.5 Open Excel Data Source.5 Open Excel Data Source 对话框对话框（三）数据编辑（三）数据编辑在 SPSS 中，对数据进行基本编辑操作的功能集中在 Edit 和 Data 菜单中。（四）（四）SPSS 数据的保存数据的保存 SPSS 数据录入并编辑整理完成以后应及时保存，以防数据丢失。选择菜单 FileSave，保存数据文件，如果数据文

16、件曾经存储过，将原文件覆盖；若想存为其他文件，选择 Save as 操作。 11 练习：将以下资料数据输入到 SPSS 的数据编辑窗口中，将民族定义为字符型变量，将身高定义为数值型变量，并保存数据文件，命名为“实验 1-1.sav” 。姓名姓别年龄民族身高(CM) 体重(KG) 白细胞红细胞血红蛋白血小板敖区翔男 4 壮族 106 17 5.02 4.72 126 218 蔡霖男 4 壮族 109 16 7.06 4.91 130 230 陈地婕女 3 汉族 108 18 5.71 4.04 120 335 陈杨男 4 苗族 103 16.5 7.09 5.09

17、135 283 陈利钏女 6 壮族 113 20 6.91 4.61 139 222 陈琪琪女 5 汉族 113 18.3 11.66 5.76 113 361 陈达屹男 4 壮族 103 15 9.27 4.83 140 423 傅俊光男 4 汉族 109 17.7 9.83 4.61 126 321 12 实验实验二二统计描述统计描述建立了数据文件之后，需要对用一些指标如均数、几何均数、中位数、百分位数、标准差、四分位数间距来对数据的集中、离散趋势、分布类型进行描述，这个过程称为统计描述。统计描述在 Analyze 中的 Descriptives 菜单实现，Descriptiv

18、es 菜单中包括frequencies、descriptive、Explore、ratio 四个子菜单，主要功能如下： 1Frequencies 过程：生成频数分布表，适合于分类资料，以及部分数值分类资料； 2Descriptive：进行一般的描述统计统计分析，包括集中趋势值，离散趋势值，偏度系数，峰度系数等。适合服从正态分布的数值变量资料，使用频率最高； 3Explore：适合于数据分布状况不清时的探索性数据分析； 4Ratio：对连个连续性变量计算相对指标。本次内容主要介绍 Frequencies、Descriptive、Explore 三个菜单。一、Frequencies 过程 Fr

19、equencies 也称频数分析，可以了解数据的分布状况。例例 2 2.1.1 对例 1.1 数据进行基本统计分析。 1打开数据文件 SY-3 后，单击 AnalyzeDescriptive Statistics Frequencies 打开频数分析对话框如图 2.1 所示。图图 2 2. .1 1 FrequenciesFrequencies 对话框对话框 13 2在左边的变量框中选择一个或多个变量进入 Variable(s)。 3选中 Display frequency tables 要求输出分布表。 4 单击 Statistics 按钮，出现 Frequencies: Statis

20、tics 对话框，如图 2.2。在 Frequencies: Statistics 对话框中选择要求输出的统计量。图图 2 2.2.2 Frequencies: StatisticsFrequencies: Statistics 对话框对话框 (1)Percentile Values 百分数选择项栏（复选项）百分数选择项栏（复选项） Quartile 四分位数， Cut points equal groups 等分位点百分位数（取值范围在 2100 之间）。 Percentile(s)自定义百分位数。（2）Dispersion 离差栏离差栏 Std.Deviation 标准差 Min

21、imum 最小值 Variance 方差 Maximum 最大值 Range 极差 S.E.mean 均值的标准误（3）Central Tendency 集中趋势栏集中趋势栏 Mean 算术平均值（均数）, Median 中位数, Mode 众数, Sum 总和. （4）Distribution 分布状态栏分布状态栏 Skewness 偏度 Kurtosis 峰度在本例中选择四分位数、10 等分的百分位点；标准差、方差、最大、最小值；全距、均值、均值的标准误，中位数、偏度、峰度等复选项，单击 Continue 回到图14 6.1 Frequencies 对话框。 5单击 Chart 按钮，

22、弹出 Frequencies: Chart 对话框，如图 2.3，。图图 2 2.3.3 Frequencies: ChartFrequencies: Chart 对话框对话框在对话框中有： Chart Type 图形栏（单选），选择输出的图形类型。 None 不输出图形（系统默许） Bar charts 条形图 Pie charts 饼图 Histograms 直方图 With normal curve 直方图中显示正态曲线（只有选择直方图时才能选择）。 Chart Values 栏，选择图形中分类值的表现形式。 Frequencies 直方图纵轴为频数，饼图中每块表示属于该组观测

23、值频数； Percentage 直方图纵轴为百分比，饼图中每块表示该组的观测量数占总数的百分比。 6单击 Continue 回到图 2.1Frequencies 对话框，单击 Format 按钮，得到对话框图6.4。图图 2 2.4.4 Frequencies: Format Frequencies: Format 对话框对话框 15 在 Frequencies: Format 对话框中： Order by 排序栏，表示频数分布表的排列顺序。(单选) Ascending values 按变量值升序排列（系统默认）。 Descending values 按变量值降序排列。 Ascending

24、 counts 按变量各种取值发生的频数升序排列。 Descending counts 按变量各种取值发生的频数降序排列。如果设置了直方图，频数表将按照变量值顺序排列。 Multiple Variables 多变量输出表格设置(单选)。 Compare variables 将所有变量的结果输出在一个表中（系统默认）。 Organize output by variables 为每一个变量输出一个表。 Suppress tables with more than _ categories 控制频数表输出的分类数复选项。Maximum number of categories 分类数最大参数值

25、，默认值是 10。本例中均选择系统默认项。点击 OK，得到输出表 2.1。表表2.1 Statistics 身高体重白细胞红细胞血红蛋白血小板 N（例数） Valid（有效值） 111 111 111 111 111 111 Missing（有效值） 0 0 0 0 0 0 Mean（均数） 104.19 16.50 7.94 4.62 123.87 280.71 Std. Error of Mean（均数的标准误） .801 .290 .171 .042 .860 6.494 Std. Deviation（标准差） 8.436 3.051 1.799 .444 9.066 68

26、.413 Variance（方差） 71.160 9.311 3.237 .197 82.184 4680.389 Skewness（偏度） .416 .845 .243 1.337 .184 .155 Std. Error of Skewness（偏度的标准误） .229 .229 .229 .229 .229 .229 Kurtosis（峰度） -.359 .838 .025 2.411 .984 1.168 Std. Error of Kurtosis（峰度的标准误） .455 .455 .455 .455 .455 .455 Range（全距） 41 17 9 2 54 419 Min

27、imum（最小值） 85 10 4 4 99 72 Maximum（最大值） 126 27 13 6 153 491 Percentiles（百分位数） 10 94.20 13.12 5.87 4.14 113.00 210.60 20 97.00 14.00 6.46 4.27 117.00 226.40 25 98.00 14.30 6.72 4.35 118.00 231.00 30 99.00 14.72 6.93 4.40 120.00 254.60 16 40 100.00 15.08 7.27 4.50 122.80 267.00 50 103.00 16.00 7.61 4.5

28、5 124.00 279.00 60 105.20 16.90 8.32 4.66 126.00 288.00 70 109.00 17.64 8.97 4.74 128.00 313.40 75 110.00 18.00 9.27 4.81 130.00 318.00 80 112.60 18.96 9.52 4.86 131.00 332.60 90 116.00 21.32 10.29 5.08 134.00 368.20 表表2.2 身高的频数表身高的频数表 Frequency （频频数数） Percent（百分率） Valid Percent （有效%） Cumulative Per

29、cent （累计%） Valid（观察值） 85 1 .9 .9 .9 90 2 1.8 1.8 2.7 91 2 1.8 1.8 4.5 93 3 2.7 2.7 7.2 94 1 .9 .9 8.1 94 2 1.8 1.8 9.9 95 8 7.2 7.2 17.1 97 1 .9 .9 18.0 97 3 2.7 2.7 20.7 98 1 .9 .9 21.6 98 4 3.6 3.6 25.2 99 7 6.3 6.3 31.5 100 10 9.0 9.0 40.5 101 3 2.7 2.7 43.2 102 2 1.8 1.8 45.0 102 3 2.7 2.7 47.7

30、103 1 .9 .9 48.6 103 8 7.2 7.2 55.9 104 3 2.7 2.7 58.6 105 2 1.8 1.8 60.4 106 2 1.8 1.8 62.2 107 7 6.3 6.3 68.5 108 1 .9 .9 69.4 109 5 4.5 4.5 73.9 110 2 1.8 1.8 75.7 111 2 1.8 1.8 77.5 17 112 3 2.7 2.7 80.2 113 4 3.6 3.6 83.8 114 1 .9 .9 84.7 115 5 4.5 4.5 89.2 116 3 2.7 2.7 91.9 117 1 .9 .9 92.8 1

31、18 1 .9 .9 93.7 119 2 1.8 1.8 95.5 120 1 .9 .9 96.4 121 1 .9 .9 97.3 122 1 .9 .9 98.2 125 1 .9 .9 99.1 126 1 .9 .9 100.0 Total 111 100.0 100.0 1301201101009080身高身高20151050FrequencyFrequencyMean = 104.19Std. Dev. = 8.436N = 111身高身高图图 2.5 身高的频数分布图身高的频数分布图二、Descriptive 过程例例 2.2 试对表 2.3 某地 140 名健康成年男

32、性血清尿素氮浓度（mmol/L）进行统计描述。 18 表表 2 2.3.3 某地某地 140140 名健康成年男性血清尿素氮浓度（名健康成年男性血清尿素氮浓度（mmol/Lmmol/L） 6.00 5.28 3.90 5.30 4.20 3.90 5.60 5.66 4.10 4.00 4.50 3.77 4.34 4.30 4.22 5.30 5.13 3.79 4.80 5.20 4.70 2.94 5.90 4.50 2.10 5.60 5.90 2.85 4.90 4.22 5.63 3.21 4.66 3.00 5.96 3.45 3.50 4.23 3.90 3.88 4.24

33、4.53 4.88 2.48 3.40 3.26 3.21 3.60 2.73 4.15 4.60 4.35 4.96 5.61 5.87 5.01 4.33 5.74 4.87 3.96 3.00 3.93 3.15 5.00 3.44 3.50 2.85 4.87 4.60 3.40 4.79 3.02 6.23 4.98 2.89 5.82 6.30 5.20 5.40 3.00 2.80 4.43 4.50 5.52 6.40 4.86 5.90 4.70 3.47 4.66 4.78 5.70 2.26 4.10 3.70 5.40 3.70 4.37 4.20 6.10 4.80

34、5.10 5.55 2.97 5.11 3.26 3.04 6.01 5.07 4.22 5.39 5.34 4.47 3.58 5.26 4.54 4.07 3.83 3.97 6.05 4.02 2.69 2.52 5.21 6.55 4.28 4.45 5.15 4.45 5.37 3.80 3.73 4.49 2.44 2.76 3.33 3.01 6.43 3.55 2.63 1 1建立数据文件建立数据文件图图 2 2.6 .6 数据文件数据文件数据结构为 1 列 140 行，列（nsd）表示变量值即血清尿素氮浓度（mmol/L），行表示记录，每一个一个记录。 2分析步骤：分析

35、步骤： 19 在 SPSS 的主画面中的 AnalyzeDescriptives Statistics Descriptives 打开Descriptives 对话框，如图 2.7 所示。图图 2.7 Descriptives 对话框对话框将 “nsd” 选入右边的 Variable(s)变量框中，单击 options 按钮，弹出 Descriptives：Options 对话框，如图 2.8 所示。图图 2.8 Descriptives：Options 对话框对话框在对话框中选项说明： Mean：均数，sum：总和 Dispersion 离差栏 20 Std.Deviation

36、标准差 Minimum 最小值 Variance 方差 Maximum 最大值 Range 极差 S.E.mean 均值的标准误 Distribution 分布状态栏 Skewness 偏度 Kurtosis 峰度 Display Order 栏，选择输出方式： Variable List 按变量表次序； Alphabetic 按字母顺序； Ascending Meas 按平均值升序； Descending Means 按平均值降序。本例选择均数、标准差、均值的标准误、偏度、峰度并在 Display Order 栏中选择Variable List，单击 Continue 按钮，返回 Desc

37、riptives 对话框，单击 OK，在输出窗口得描述统计分析输出表，如表 2.4。表表 2.4 Descriptive Statistics N Mean Std. Deviation Skewness Kurtosis Statistic Std. Error Statistic Std. Error Statistic Std. Error Statistic Std. Error Statistic Std. Error Nsd 140 4.3822 .08869 1.04943 -.036 .205 -.804 .407 Valid N (listwise) 140 三、三、E E

38、xploxplor r 过程过程探索分析是对数据进行初步的观察分析，主要的分析项目有： 1 观察数据的分布特征：可通过绘制箱图和茎叶图等图形直观地反映数据的分布形式和数据的一些规律性，包括考察数据中是否存在异常值等。 2正态分布检验：检验数据是否服从正态分布。 3方差齐性的检验：用 Levene 检验比较各组的方差是否相等。以例 1.1 的数据为例，进行说明。 21 1打开数据文件 tj.sav，单击 Analyze-Descriptive statistics-Explore，打开 Explore主对话框，如图 2.9 所示：图图 2.9 E Explorxplor 对话框对话框（

39、1）从左侧的变量列表中选择变量”身高”，击入 Dependent List 栏；（2）选择“性别”作为因子变量（相当于分组变量），击入 Factor List 栏。（3）Label Case 为变量值标识栏，本例不选。在 Display 栏中选择输出项，依次是 Both 选择项，输出图形与描述统计量（系统默认），只输出描述统计量和只输出图形。本例中选择默认项。 2单击 Statistics 统计量按钮，打开 Statistics 对话框,选择统计输出量。有四个选择项，分别是： Descriptives基本统计描述。同时指定均值的置信区间的置信度，系统默认为95。 M-估计

40、（M 估计在计算时对所有观测量赋予权重，随观测量距分布中心的远近而变化）； Outliers 输出分析数据中五个最大值和五个最小值； Percentiles 输出百分数。本例中选择 Descriptives 和 Outliers 后，返回主对话框。如图 2.10 所示。 22 图图 2 2.10.10 E Explorxplor: :StatisticsStatistics 对话框对话框 3单击 Continue，回到图图 2.9 E Explorxplor 对话框对话框，再，再单击 Plots 图形按钮，打开 Plots对话框，如图 2.11 所示。图图 2 2.11.11 E Ex

41、plorxplor: :PlotsPlots 对话框对话框对话框中有四个选择栏：（1）Boxplot 箱图选择栏。 Factor levels together 因变量按因素水平分组（系统默认）； Dependents together 所有因变量生成一个并列箱图； None 不显示箱图。箱图中，最底部的水平线段是数据的最小值（异常点除外），顶部的水平线段是23 数据的最大值（异常点除外），中间矩形箱子的底所在位置是数据的第一个四分位数（即 25分位数），箱子顶部所在位置是数据的第三个四分位数据（即 75分位数）。箱子中间的水平线段刻画的是数据的中位数（即 50分位数）

42、。（2）Descriptive 描述图形栏（复选项）。 Stem-and-leaf 茎叶图（系统默认） Histogram 直方图（3）Normality plots with test(复选项)，正态分布检验并输出 Q-Q 图。（4）Spreadvs level with Levene Test 栏，对所有的散布层次图，同时输出回归直线的斜率以及方差齐性的 Levenes 检验，但如果没有指定分组变量，此选择项无效。四个单选项依次为： None：不产生回归直线的斜率和方差齐性检验（系统默认）； Power Estimation 转换幂值估计（对每组数据产生一个中位数自然对数

43、及四个分位数的自然对数的散点图）选项； Transformed 变换原始数据选择项（可在参数框中选择数据变换类型）； Untransformed 不变换变换原始数据选择项。本例中选择茎叶图，正态分布检验，方差齐性检验等。 4 单击 Option 按纽，打开 Option 对话框如图 2.12 所示。可选择缺失值的处理方式，SPSS 提供三种处理方式：图图 2.12 探索分析探索分析 Option对话框对话框 Exclude cases listwies 剔除带缺失值的观测量（系统默认）。本例选择此项。 Exclude cases pairwise 剔除带缺失值的观测量时还一并剔除与

44、缺失值有成对关系的观测量。 Report values 输出频数表时同时输出缺失值。 5单击 OK，得到相应的输出结果如表 2.5、2.6 所示。 24 表表2.5 2.5 描述描述表表2.6 2.6 正态性检验正态性检验从表 2.6 的检验结果可以看出，女生 P 值均大于 0.05，故可以认为女生的身高分布25 都近似地服从正态分布；男生身高不同的检验方法一个大于 0.05，一个小于 0.05，其正态性有待进一步验证。练习：从某单位 2009 年的职工体检资料中获得 101 名正常成年女子的血清总胆固醇（mmol/L）的测量结果如下，请判断其资料分布类型，并选择合适的集中趋势和离散趋

45、势指标进行分析。 2.352.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.

46、84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.715.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26 26 实验实验三三 t 检验检验 t 检验主要用于两个均数的比较，按设计类型的不同，可分为样本均数与总体均数比较的 t 检验，配对 t 检验，和两个样本均数

47、比较的 t 检验。在 SPSS 中是在 Analyze 菜单中 Compare Means 子菜单中实现。其要求样本来自正态分布总体，两样本平均值比较时还要求两总体方差相等。 1样本均数与总体均数比较的样本均数与总体均数比较的 t 检验检验也称单个总体均值的 t 检验（One-Sample T Test），用于比较样本均数代表的未知总体均数和已知总体均数 0差异是否有统计学意义。例例 3.1 已知某小样本中含 CaCO3的真值是 20.7mg/L。现用某法重复测定该小样本15 次，CaCO3含量（mg/L）分别为：20.99，20.41，20.62， 20.75，20.10，20.

48、00，20.80，20.91，22.60，22.30，20.99，20.41，20.50， 23.00，22.60。问该法测得的均数与真值有无差别？（1）建立数据文件，一列 15 行，即变量 CaCO3的测定值： 27 图图 3.1 数据文件数据文件（2）操作步骤：单击 Analyze Compare Means One-Sample T Test，打开 One-Sample T Test 主对话框，如图 3.2 所示。图图 3.2 One-Sample T Test 对话框对话框 28 从左边框中选中需要检验的变量（VAR00001）进入检验框中（Test Variable(s)）

49、。在 Test Value 框中键入原假设的均数为 20.7。单击 Options 按钮，得到 Options 对话框（如图 3.3），选项分别是置信度（默认项是 95）和缺失值的处理方式。选择 Continue 后返回主对话框。图图 3.3 One-Sample T Test: Options 对话框对话框单击 OK，出现输出结果。如表 3.1、3.2 所示。表表3.1 One-Sample Statistics N Mean Std. Deviation Std. Error Mean VAR00001 15 21.1320 .98416 .25411 表 3.1 中，列出统计

50、描述的主要结果，包括样本例数（N）、均数（Mean）、标准差（Std. Deviation）、标准误（Std. Error Mean）。表表3.2 One-Sample Test Test Value = 20.7 t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the Difference Lower Upper VAR00001 1.700 14 .111 .43200 -.1130 .9770 表 3.1 中，列出结果包括 t 值、自由度（df），双侧 P 值（Sig. (2-tailed)），

展开阅读全文