收藏 分享(赏)

分布式容错ppt课件.ppt

上传人:顺腾 文档编号:3470746 上传时间:2021-01-24 格式:PPT 页数:11 大小:219.50KB
下载 相关 举报
分布式容错ppt课件.ppt_第1页
第1页 / 共11页
分布式容错ppt课件.ppt_第2页
第2页 / 共11页
分布式容错ppt课件.ppt_第3页
第3页 / 共11页
分布式容错ppt课件.ppt_第4页
第4页 / 共11页
分布式容错ppt课件.ppt_第5页
第5页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、分布式容错 v分布式系统容错介绍 分布式容错系统是一个自主运行的系统,这种系统具有 较强的免疫能力,尽量保证某些错误或者恶劣环境不会导致 系统产生故障。同时,系统还具有较强的自愈能力。一旦发 生故障,系统不需要外部的干预,通过自身的容错功能,自 动从失效中恢复过来,并且不会对整个系统的性能产生严重 的影响。 免疫:系统具有防范某些故障发生的能力。 自愈:系统具有监测、发现、容忍、处理故障和恢复正常的 能力。 1 容错是建立在冗余的基础上的,而冗余 是指设置超过正常系统操作所需要的信息 、资源或时间。 2 v分布式系统的容错方法 依靠硬件冗余设计 通过采用各种专用芯片、特殊电路和专 门的实现手段

2、 依靠软件 通过容错调度算法解决分布式系统容 错问题 该方法的优点是不需要额外的硬件代价 实现提高系统的可靠性 3 v冗余类型 物理冗余 可以用硬件冗余的方式或软件冗余的方式来实 现,因为硬件和软件在逻辑上是等同的。 信息冗余 海明码 时间冗余 原子操作和原子事务处理在执行中如果出现故 障,相当于它们没有被执行,系统的状态保持不变, 所以它们可以重新执行,只是需要额外的时间。 4 分布式容错基本原理 v分布式系统故障的最常见形式是静默失效(fail silent),这时出故障节点的处理机不再响应任 何输入,也不再产生任何输出。 在分布式容错系统中,可以采用监视器进程检 测主机的控制流的方法来发

3、现节点的静默失效。 5 单节点静默失效 单节点静默失效: 主节点的静默失效 备份节点的静默失效 6 主节点的静默失效 当备份节点的监视器进程Watchdog发现主节 点失效时,就向系统管理员发出失效警告,同时 运行主节点备份进程从而升格为主节点。在对失 效节点排除故障重新启动后,原主节点就成为备 份节点并运行监视进程;新的主节点的服务器进 程MP收到新的备份节点监视进程发来的消息后, 就终止本节点的监视进程,从而使系统恢复到失 效前的正常工作状态。对于失效时未完成的客户 服务,原主节点停止执行,在备份进程启动后再 接受客户请求。 7 备份节点的静默失效 可以采用由主节点的服务器进程MP定时 检

4、测备份节点的方法。发现其失效后,在本 地节点运行监视进程,同时向管理员发出备 份节点失效的警告。其后的恢复过程同主节 点失效一样。 8 系统分布式容错 系统设计采用被动式的主机备份机 9 系统设计采用被动式的主机备份机 运行模式:主机运行服务器进程,响应客 户进程的服务请求,完成各项服务,备份 机运行监视进程与备份服务器进程,监视 主机的运行状况,在主机完成某个服务请 求时备份主机的相应工作状态 10 恢复步骤 v当主机由于掉电或其它故障造成失效时,备份机 用该机的服务器进程接替原来主机上的服务器进 程的工作,并发出主机失效的报告。 v失效节点在消除故障重新工作后,自动充任备份 机,运行监视进程,向此时的主机发出监视进程 运行的消息 v主机收到该消息后,停止本节点监视进程的工作 ,恢复双机备份工作模式。 11

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 应用文书 > PPT文档

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报