1、第九章 双变量回归与相关 本章内容: 第一节 直线回归 第二节 直线相关 第三节 秩相关 第四节 加权直线回归(不讲) 第五节 两条回归直线的比较(不讲 ) 第六节 曲线拟合(简单介绍) 双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值 (X1,Y1), (X2,Y2), , (Xn,Yn) 目的:研究X和Y的数量关系 方法:回归与相关 简单、基本直线回归、直线相关 第一节 直线回归 一、直线回归的概念 目的:研究应变量Y对自变量X的数量依 存关系。 特点:统计关系。 X值和Y的均数的关系 , 不同于一般数学上的X 和Y的函数 关系。 为了直观地
2、说明直线回归的概念, 以8名儿童的年龄(岁)与其尿肌 酐含量(mmol/24h)数据(见例9-1) 在坐标纸上描点,得到图9-1所示 散点图(scatter plot)。 在定量描述儿童年龄与其尿肌 酐含量数量上的依存关系时,将 年龄称为自变量(independent variable),用 X 表示;尿肌酐含量 称为应变量(dependent variable),用 Y 表示。 由图9-1可见,尿肌酐含量 Y 随年龄 X 增加而增大且呈直线趋势,但并非8个点子 恰好全都在一直线上,此与两变量间严格 的直线函数关系不同,称为直线回归(linear regression),其方程叫直线回归方程,
3、以区别严格 意义的直线方程。 回归是回归分析中最基本、最简单的一种, 故又称简单回归。 直线回归方程的一般表达式为 为各X处Y的总体均数的估计。 1a 为回归直线在 Y 轴上的截距 。 a 0,表示直线与纵轴的交点在 原点的上方; a 0,直线从左下方走向右上方,Y 随 X 增大而增大 ; b0,直线从左上方走向右下方,Y 随 X 增大而减小 ; b=0,表示直线与 X 轴平行,X 与Y 无直线关系。 b 的统计学意义是:X 每增加(减)一个 单位,Y 平均改变b个单位。 英国人类学家 F.Galton首次在自然遗传 一书中,提出并阐明了“相关”和“相关系数 ”两个概念,为相关论奠定了基础。其
4、后,他 和英国统计学家 Karl Pearson对上千个家庭的 身高、臂长、拃长(伸开大拇指与中指两端 的最大长度)做了测量,发现: 历史背景: 儿子身高(Y,英寸)与父亲身高(X ,英寸)存在线性关系: 也即高个子父代的子代在成年之后的 身高平均来说不是更高,而是稍矮于其父 代水平,而矮个子父代的子代的平均身高 不是更矮,而是稍高于其父代水平。 Galton将这种趋向于种族稳定的现象称之 “回归”。 目前,“回归”已成为表示变量 之间某种数量依存关系的统计学术 语,并且衍生出“回归方程”“回归系 数”等统计学概念。如研究糖尿病人 血糖与其胰岛素水平的关系,研究 儿童年龄与体重的关系等。 残差
5、(residual)或剩余值,即实测值Y与假 定回归线上的估计值 的纵向距离 。 求解a、b实际上就是“合理地”找到一条能 最好地代表数据点分布趋势的直线。 原则:最小二乘法(least sum of squares),即可 保证各实测点至直线的纵向距离的平方和最小 二、直线回归方程的求法 例9-1 某地方病研究所调查了8名正 常儿童的尿肌酐含量(mmol/24h)如表9-1 。估计尿肌酐含量(Y)对其年龄(X) 的回归方程。 表9-1 8名正常儿童的年龄 (岁)与尿肌酐含量 (mmol/24h) 解题步骤 此直线必然通过点( , )且与纵坐标轴相 交于截距 。如果散点图没有从坐标系原 点开始
6、,可在自变量实测范围内远端取易 于读数的 值代入回归方程得到一个点的 坐标,连接此点与点( , )也可绘出回 归直线。 三、直线回归中的统计推断 (一)回归方程的假设检验 建立样本直线回归方程,只是完 成了统计分析中两变量关系的统计描 述,研究者还须回答它所来自的总体 的直线回归关系是否确实存在,即是 否对总体有 ? 1方差分析 数理统计可证明: 上式用符号表示为 式中 上述三个平方和,各有其相应的自由度 ,并有如下的关系: 如果两变量间总体回归关系确实存在,回 归的贡献就要大于随机误差,大到何种程度 时可以认为具有统计意义,可计算统计量F: 式中 2. t 检验 例9-2 检验例9-1数据
7、得到的直线回归方程是否 成立? (1)方差分析 表9-2 方差分析表 列出方差分析表如表9-2。 (2)t 检验 注意: (二)总体回归系数 的可信区间 利用上述对回归系数的t检验,可 以得到的1双侧可信区间为 例9-3 根据例9-1中 所得b=0.1392,估计其 总体回归系数的双侧 95%可信区间。 (0.1392-2.4470.0304,0.1392+2.4470.0304) =(0.0648,0.2136) (三)利用回归方程进行估计和预测 (9-15) (9-14) 反映其抽样误差大小的标准误为 (9-16) (9-17) 例9-4 用例9-1所得直线回归 方程,计算当X0=12时,
8、 的 95%可信区间和相应个体值的 95%预测区间。 计算步骤 例9-1、例9-2已计算出 第二节 直线相关 直线相关(linear correlation)又称简单相关(simple correlation),用于双变量正态分布(bivariate normal distribution)资料。其性质可由图9-6散点图直观的说 明。 目的:研究 两个变量X,Y数量上的依存(或相 关) 关系。 特点:统计关系 一、直线相关的概念 二、相关系数的意义与计算 1. 意义:相关系数(correlation coefficient)又 称Pearson积差相关系数,用来说明具有直线关 系的两变量间相关
9、的密切程度与相关方向。 相关系数没有单位,其值为-1 r 1。r值为正 表示正相关,r值为负表示负相关,r的绝对值等 于1为完全相关,r=0为零相关。 2. 计算:样本相关系数的计算公 式为 (9-18) 由例9-1算得, 按公式(9-18) 例9-5 对例9-1数据(见表9-1),计算8名 儿童的尿肌酐含量与其年龄的相关系数。 三、相关系数的统计推断 (一)相关系数的假设检验 (9-19) 例9-6 对例9-5所得 r 值,检 验尿肌酐含量与年龄是否有直线 相关关系? 检验步骤 本例n=8,r=0.8818,按公式(9-19) (二)总体相关系数的可信区间 具体步骤如下 例9-7 对例9-5
10、所得r值,估计总体相 关系数的95%可信区间。 再按公式(9-22)将z作反变换,得到年龄与尿肌酐含 量的总体相关系数95%可信区间为(0.4678,0.9971)。 四、决定系数(coefficient of determination) 定义为回归平方和与总平方和之比,计 算公式为: (9-23 ) 取值在0到1之间且无单位,其数值大 小反映了回归贡献的相对程度,也就是在Y的 总变异中回归关系所能解释的百分比。 五、直线回归与相关应用的注意事项 1根据分析目的选择变量及统计方法 直线相关用于说明两变量之间直线关系的方向和 密切程度,X与Y没有主次之分; 直线回归则进一步地用于定量刻画应变量
11、Y对自变 量X在数值上的依存关系,其中应变量的定夺主要依 专业要求而定,可以考虑把易于精确测量的变量作为 X,另一个随机变量作Y,例如用身高估计体表面积。 两个变量的选择一定要结合专业背景,不能把毫 无关联的两种现象勉强作回归或相关分析。 2进行相关、回归分析前应绘制散点图第一步 (1) 散点图可考察两变量是否有直线趋势; (2) 可发现离群点(outlier)。 散点图对离群点的识别与处理需要从专业知识和现有 数据两方面来考虑,结果可能是现有回归模型的假设错 误需要改变模型形式,也可能是抽样误差造成的一次偶 然结果甚至过失误差。需要认真核对原始数据并检查其 产生过程认定是过失误差,或者通过重
12、复测定确定是抽 样误差造成的偶然结果,才可以谨慎地剔除或采用其它 估计方法。 3资料的要求 直线相关分析要求 X与Y 服从双变量正态分布; 直线回归要求至少对于每个 X 相应的 Y 要服从正 态分布,X可以是服从正态分布的随机变量也可以是 能精确测量和严格控制的非随机变量; * 对于双变量正态分布资料,根据研究目的可选 择由 X 估计 Y 或者由 Y 估计 X ,一般情况下两个回 归方程不相同)。 反应两变量关系密切程度或数量上影响大小的 统计量应该是回归系数或相关系数的绝对值,而 不是假设检验的P值。 P值越小只能说越有理由认为变量间的直线关系 存在,而不能说关系越密切或越“显著”。另外,
13、直线回归用于预测时,其 医院感染控 制 附属医院副主任医师 牛瑞 丽 Tel:13980351916 Email:NRL123 医院感染控制 l是研究在医院获得的一切感染性疾病的发生 、发展和控制管理的一门学科,其基础学科 为临床微生物学与免疫学、临床流行病学、 抗菌药物学与消毒药物学,其临床学科为感 染疾病学与管理学。 l学科核心期刊:中华医院感染学杂志 中国消毒学杂志 课程目标要求: l掌握医院感染相关的基础理论知识,掌握 医院感染与护理工作密切相关的内容。 l熟悉医院感染控制中的基础护理和专科护 理工作。 l通过各个教学环节逐步培养学生临床思维 能力及预防、发现、控制医院感染的能力 。
14、第一章 绪论 l一. 基本概念 l二.医院感染发展史 l三.医院感染控制有何重要性 l四.全球感染性疾病发展趋势 l五.医院感染的现状及控制策略 l六.医院感染与护理学科的关系 l七.医院感染分类 l八.医院感染的时间界限 l九.医院感染的学科建设 课堂目标: 一. 掌握基本概念(医院感染、) 二.医院感染分类 三.医院感染的时间界限 感染 (1)概念 感染的概念按 所示为: 病原体侵袭宿主机体表面或内 部并在此寄居的现象,伴有或不伴有疾 病的发生;仅于病原体有致病力,对人体 造成明显损害时才引起感染性疾病。 感染的实质是微生态平衡与微生态 失调相互转化的表现形式。 医院感染(nosocomi
15、al infection NI) (1)概念 医院感染是指住院病人在医院内获得的 感染,包括在住院期间发生的感染和在医院 内获得出院后发生的感染,但不包括入院前 已开始或入院时已存在的感染。医院工作人 员在医院内获得的感染也属于医院感染。 卫生部2001年颁布 的 医院感 染诊断标准 (2)感染的类型 病原体被清除、病原携带状态、 隐性感染、显性感染(急性感染、慢性感 染、慢发感染、潜伏感染) 医院感染定义明确了以下几点: 感染必须是在医院内获得。 感染与发病是在不同阶段产生的,其顺 序是感染潜伏期发病。因此潜伏期 是判断感染发生时间与地点的重要依据 。 包括一切在医院内活动的人群,即病人 、
16、医院工作人员、陪护和探视者等,均 可发生医院感染。 医院感染定义明确了以下几点: 医院感染多数是在病人住院期间发病,但潜 伏期较长的病也有在医院受感染于出院后发 病的,如HBV。 在入院前已处于潜伏期的病人入院后发病的 不属于医院感染,但在实践中和医院感染不 易区分,一方面依靠潜伏期区分,另一方面 还可从流行病学和临床资料进行分析判断。 医院感染定义适用于各级医疗机构、保健机 构和基层诊所。 (2)监测对象 在医院感染的监测中以病人为主要 观察对象。 只有在感染暴发时才将医务人员、 陪护人员列为调查对象。以便找出暴发 的感染源与传播途径。 二.医院感染发展史 l最初的探索期 1960s l展期
17、 1970s l反和反 1980s l条例和指南 1990s l干性流行病学 2000年 后 我想 知道 -南丁格尔 42%到2.7%的 改变 隔离 病房通风 戴手套 飞舞的尘埃与消毒的发明 李斯特 医疗机构相关性感染的严重程度 三医院感染控制有何重要性? 保障病人安全 提高医疗质量 维护医务人员职业健康 四全球感染性疾病发展趋势 1.多重耐药细菌感染增多 2.结核分枝杆菌感染流行 3.与全球气候变暖相关的感 染性疾病增加 4.新的人畜互通性感染发生 5. 相继出现的新传染病 五.医院感染的现状及控制策略 l全球医院感染流行概 况 l全球医院感染控制发 展的阻力 l发展中国家的医院感 染现状
18、全球医院感染流行概况 l任何时候,全球有 140多万人发生医疗 机构相关性感染. l发达国家,有5 10%的病人在现代 化医院获得1种或更多的感染. l发达国家急症医院病人的医院感染率平 均约812。 l发达国家重症病人的医院感染危险性高 1540。 全球医院感染流行概况 l在某些发展中国家,医疗机构相关性 感染超过25。 l发展中国家医院感染的危险性是发达 国家的220倍。 l在英国,每年每10万例医疗机构相关 性感染直接导致5000例病人死亡。 全球医院感染控制发展的阻力 l国家行政机关对医院感染控制的关注不够 l医务人员对医院感染的重要性缺乏认识 发展中国家医院感染现状 l基础设施不完善
19、 l药品质量欠缺 l管理不力 l感染控制能力较差 l个人技术有限 l意识的缺乏 l卫生保健资源相对匮 乏 医疗机构相关性感染控制面临的挑战 l基础疾病的加重,患者感染的易感性增高 l医务人员手卫生依从性差 l侵入性医疗器械应用增加 l危重疾病的干预护理增多 l缺乏获得安全用水的途径 医疗机构相关性感染控制面临的挑战 l使用不清洁的器械,不干净的环境 l医务人员不足 l患者床位占用率高 l患者流动性大 (二)医院感染控制策略 1.采用最佳的监测系统 2.隔离措施 3.洗手和手消毒 4.静脉输液 5.外科护理 6.消毒灭菌和抗菌剂 7.机械通气 8.导尿管 9.医务人员的健康 10.合理使用抗菌药
20、物 11.微生物实验室 20052006年全球患者安全挑战的主 题: 干净的保健 是更安全的保健 我们所需要做的是: 做出承诺和采取行动 确保实现每一位患者获得最清洁和最 安全的护理的权利。 以“干净的保健是更安全的保健”为主题的全 球患者安全挑战的主要行动 l手卫生 l血液安全 l注射和疫苗接种 l水和基本卫生 l废弃物的管理 l临床操作 六.医院感染与护理学科的关系 1.医院感染是护理学理论基 础之一 2.护理学是医院感染管理的 重要内容 3.护理队伍是医院感染控制 的主力军 4.护理工作在预防医院感染 中具有重要性 七.医院感染分类 (一)外源性感染 (二)内源性感染 (一)外源性感染(
21、交叉感染) 病原体来自病人体外,即来自其他住院 病人、医务人员、陪护家属和医院环境。 这类感染在经济落后国家占的比例较大, 可呈医院感染暴发,如:MRSA、SARS。 外源性感染可以通过加强消毒、灭菌、隔 离措施和宣传教育工作得到预防和控制。 (二)内源性感染(自身感染) 病原体来自病人自身储菌库(皮肤、口咽、 泌尿生殖道、肠道)的正常菌丛或外来的已定植 菌。 在医院中当人体免疫功能下降、体内微生 态环境失衡或发生细菌易位时即可发生感染。 这类感染呈散发性,发生机制较复杂,涉 及病人基础病、诊疗措施等多种因素,从目前 而言,是难以预防的, 因此内源性感染的预防和控制是国内外学 者研究的热点。
22、八.医院感染的时间界限 根据医院感染诊断标准: 1.无明确潜伏期的感染,规定入院 48小时后发生的感染为医院感 染。 案例1(108053): 案例2 (0134968): 2.有明确潜伏期的感染,自入院时起超过 平均潜伏期后发生的感染为医院感染。 案例3(856743): 3.无植入物手术后30天内、有植入物手术 后1年内发生的与手术有关并涉及切口深部 软组织(深筋膜和肌肉)的感染。 入院 前后 医院感染 (48h) 超过平均潜伏期后医院感染 一、下列情况属于医院感染 1本次感染直接与上次住院有关。 2在原有感染基础上出现其它部位新 的感染(除外脓毒血症迁徙灶),或在原 感染已知病原体基础上
23、又分离出新的 病原体(排除污染和原来的混合感染)的 感染。 3新生儿在分娩过程中和产后获得的 感染。 4由于诊疗措施激活的潜在性感染, 如疱疹病毒、结核杆菌等的感染。 二、下列情况不属于医院感染 1皮肤粘膜开放性伤口只有细菌定植而无炎 症表现。 2由于创伤或非生物性因子刺激而产生的炎 症表现。 3新生儿经胎盘获得(出生后48小时内发病) 的感染,如单纯疱疹、弓形体病、 水痘等。 4患者原有的慢性感染在医院内急性发作。 案例4(0122137) 案例1(108053): 余祥蓉 女 38岁 车祸伤 2005.2.27入 院,留置尿管.3.1117,T:38-38.50C, 高39.80C,3.1
24、1尿培养:大肠埃希氏菌, 镜检:WBC 6-8/HP, 因留置尿管无主诉 尿路刺激症状. 报医院感染报卡:尿路感染 案例2(0134968): 刘阳 男 3岁 右额颞头皮裂伤 右额硬膜外血肿 右额及眶顶线性骨折 右侧尺桡骨远端开放性 双骨折 右肘肱桡关节脱位. 2007.6.27.21:33 入院.入院前1小时玩耍时不慎从8米高的崖坎 上摔下,入院后立即行清创缝合,6.28.19:15 T:39.50C 咽充血,双扁桃体0红肿 双肺呼吸 音粗. 报医院感染报卡:上呼吸道感染 (患儿3岁,病情重,反应迅速,故感染时限未达入 院后48小时仍考虑为医院感染.) 案例3(856743): 钱文军 男 29岁 1999.10.24以上消化道出血(+) 收入内二科.入院时T、P、R、BP均正常。 10.26.10:30胃镜检查,在十二指肠降段后壁见一 2.5亚蒂息肉,顶