收藏 分享(赏)

《网络工程设计与实践》课件第10章.ppt

上传人:bubibi 文档编号:24175220 上传时间:2024-11-28 格式:PPT 页数:146 大小:763KB
下载 相关 举报
《网络工程设计与实践》课件第10章.ppt_第1页
第1页 / 共146页
《网络工程设计与实践》课件第10章.ppt_第2页
第2页 / 共146页
《网络工程设计与实践》课件第10章.ppt_第3页
第3页 / 共146页
《网络工程设计与实践》课件第10章.ppt_第4页
第4页 / 共146页
《网络工程设计与实践》课件第10章.ppt_第5页
第5页 / 共146页
亲,该文档总共146页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第10章 网络故障及其处理 第10章 网络故障及其处理 10.1 常见的网络系统故障常见的网络系统故障 10.2 网络故障的分析与检测方法网络故障的分析与检测方法 10.3 排除网络故障的常用工具排除网络故障的常用工具 10.4 网络测试网络测试 10.5 网络故障的解析举例网络故障的解析举例 第10章 网络故障及其处理 10.1 常见的网络系统故障常见的网络系统故障10.1.1 网络系统故障概述网络系统故障概述一个网络系统通常由硬件、软件和连接介质等几个部分组成。1)网络硬件计算机:服务器、工作站、终端机等,它们的组成部件(如主板、内存、硬盘、接口与通道等)的故障一般可通过机器的自检及常规硬

2、件测试程序检查出来。服务器故障将引起整个网络工作异常,而工作站故障一般只影响该工作站本身。网络设备:网卡、中继器、调制解调器、集线器、路由器、网关、网桥、交换机等,它们的故障是网络系统故障的主要原因。第10章 网络故障及其处理 2)网络软件网络软件由网络操作系统、网络管理软件、网络通信软件与网络应用软件等组成。软件配置错误,软件组合使用冲突,网络通信协议失配等都会引起严重的网络系统故障。电脑病毒与黑客入侵也会引起严重的网络系统故障。3)连接介质常见的网络连接介质有屏蔽双绞线、非屏蔽双绞线、同轴线缆、光纤等。连接介质的故障是引起网络系统故障最常见的原因。4)其他故障原因因电源、地线等可引起故障,

3、因静电、无线电干扰可引起故障,以及因网络信息流量过大可引起网络瘫痪等。第10章 网络故障及其处理 10.1.2 通信媒介故障通信媒介故障网络故障很容易发生在通信媒介上,常见故障主要有线缆断开、线缆短接、连接故障、信号衰减。通信媒介故障是网络失效最常见的原因之一,例如一个接头松开或终结器连接不良,都会引起整个总线型网络工作瘫痪,因此当网络故障发生时,网络管理员和网络工程技术支持人员往往一开始就是检查网络的通信媒介。特别是在计算机(重新配置)、网卡(更换)、驱动器(去掉或更新)等硬件更改之后,和在对系统有危险的测试之前应先检查布线。第10章 网络故障及其处理 确定通信媒介出现故障后,应从下面几方面

4、着手定位故障所在:(1)对于总线型网络,首先要检查终结器是否正常。(2)确保各个线缆牢固地连接在各台计算机上,其接头处没有松动。(3)确保所有线缆没有超过使用的规定长度。表10.1给出了各种通信媒介的最大连接长度。第10章 网络故障及其处理 表表10.1 各种通信媒介的最大连接长度各种通信媒介的最大连接长度第10章 网络故障及其处理(4)确保各个线缆是同类的,如果不是同类线缆,则必须用诸如路由器、网桥等专用设备进行连接,而且要确保这些设备正常工作。(5)利用线缆测试设备(如数字万用表、时域反射仪等)对网络通信媒介进行检查,判断线缆是否短路、断路。(6)检查网络中的计算机数目是否符合规定,如果数

5、目超过规定,有可能造成信号衰减过多。第10章 网络故障及其处理 10.1.3 计算机故障计算机故障1.服务器故障服务器故障服务器出现故障的原因:(1)磁盘存储空间太小。(2)内存与缓冲存储器不足。(3)服务器设置不正确。(4)数据通道带宽不足。第10章 网络故障及其处理 2.工作站故障工作站故障工作站出现故障的原因:(1)工作站本身硬件故障。(2)网卡配置不正确。(3)连接线缆有问题。(4)工作站的软硬件配置冲突。第10章 网络故障及其处理 10.1.4 通信设备故障通信设备故障网络出现故障,可能是网络问题,也可能是通信设备问题。通信设备的故障会引起网络瘫痪或网络通信性能降低。排除通信设备故障

6、,可以从以下几方面着手:1.网卡网卡网卡是网络中常出故障的设备。网卡引起故障的可能包括:(1)网卡松动。(2)网卡损坏。(3)网卡的配置发生错误。(4)网卡与系统不兼容。(5)网卡的驱动程序与网卡不匹配。第10章 网络故障及其处理 在排除网卡故障的过程中,可以从下面几方面着手:1)观看网卡的指示灯网卡背面应该有两个指示灯,一个是连接指示灯,用于显示网卡已在OSI模型的数据链路层中和网络建立了连接。在正常的情况下,它应该在计算机工作期间一直亮着。另一个是信号传输指示灯,在正常的情况下,该灯在计算机发送和接收数据时“闪烁”。第10章 网络故障及其处理 2)查看网卡的设置是否正确网卡的配置参数有:(

7、1)中断请求向量IRQ。(2)I/O端口地址。(3)存储器基地址。(4)收/发类型。以上参数设置发生任何错误,或与其他的设备发生冲突,网卡将不能正常工作。因此应该确保它们设置正确且没有冲突。3)网卡的驱动程序确保网卡驱动程序与网卡相匹配,且版本没有过时。第10章 网络故障及其处理 2.路由器路由器路由器引起故障的可能包括:(1)路由器设置不正确。(2)路由器硬件故障。(3)路由协议问题。3.交换机交换机交换机引起故障的可能包括:(1)交换机硬件故障。(2)线路连接与端口故障。(3)交换机软件问题。第10章 网络故障及其处理 10.1.5 协议失配协议失配计算机网络通信,除了需要通信设备与通信媒

8、介之外,还需要一组互相认同的协议。如果两台计算机的协议不同,它们之间必须有其他的设备来进行协议转换,否则就无法通信,协议失配会造成网络通信失败。协议失配是指两台计算机因所用的协议不同而导致无法通信。同时,协议失配也包括由于协议配置错误引起的网络故障。排除协议失配故障,可以从以下几方面着手:(1)查看计算机安装了哪些协议,各个协议是否绑定到网卡上。(2)利用工具检测各个协议是否正确。(3)查看各个安装协议的所有配置参数是否正确。第10章 网络故障及其处理 对于IPX/SPX协议网络,应查看当前使用数据帧的正确性;查看自动检测数据类型设置或手工检测数据包类型设置下是否能正常工作。对于TCP/IP协

9、议网络,应查看IP地址、子网屏蔽号和默认路由号填写的正确性,验证动态IP地址获得的有效性与网段域命名系统的有效性。第10章 网络故障及其处理 10.1.6 网络堵塞网络堵塞网络堵塞是指网络的一部分或整个网络性能下降,主要体现在网络的传输速度降低。引起网络堵塞的原因很多,确定引起网络堵塞原因的最好办法是利用协议分析器或网络监视器,对网络使用的带宽、高峰使用次数和正在传输的数据帧进行监视。对于网络堵塞故障的排除,可以从以下几方面着手:(1)如果网络堵塞从网络建成后就一直存在,则可能是因为网络规划不合理。(2)用户数的大量增加会引起网络堵塞。第10章 网络故障及其处理(3)网络中大量发送数据帧的计算

10、机工作不正常,原因可能为不正常网卡发送了大量不必要的数据包导致网络堵塞,或计算机正在运行某个产生大量数据包的应用程序。(4)检查网络上的传输协议,如果协议过多,会导致网络速度减慢。10.1.7 网络风暴网络风暴网络风暴是指由于网络上过多的广播数据帧,几乎占满了网络整个带宽而导致网络速度极慢的一种故障。引起网络风暴的可能原因是:(1)网卡故障。(2)集线器故障。(3)NetBEUI网络上过多的广播信息。第10章 网络故障及其处理 10.2 网络故障的分析与检测方法网络故障的分析与检测方法1.分离法分离法故障分离法是一种故障的结构化分析方法。这种方法对网络故障的定位和排除采用逐步分析和循环重复的形

11、式,直到解决网络故障为止。该方法可分为以下几个步骤:(1)确定故障优先级。(2)收集故障有关的信息。(3)确定可能引起故障的原因。(4)进行故障分离测试。(5)分析测试结果,排除网络故障。(6)记录故障排除过程、总结经验。第10章 网络故障及其处理 故障分离法的工作流程如图10.1所示。图10.1 故障分离法的工作流程第10章 网络故障及其处理 1)确定故障优先级当网络出现的故障不止一个时,把所有故障按照一定的原则排成一个队列,按照这个队列的先后顺序逐个地排除。故障排队的原则是,根据故障的重要性以及它的影响程度,把紧迫问题放在前面,一般性问题放在后面。2)收集故障有关信息与故障有关的信息能帮助

12、我们进行分析和定位故障。信息主要来源于故障现象、用户报告,网络操作系统所提供的网络监视工具与监视软件报告等。第10章 网络故障及其处理 3)确定可能引起故障的原因在收集故障信息的基础上,根据自己的经验和有关的资料对收集到的故障信息进行评价和分析,以充分的理由来确定发生故障的可能原因。确定原因时要把所有可能的原因作一个列表,并且把原因按可能性由大到小进行排列。第10章 网络故障及其处理 4)进行故障分离测试对网络故障进行分离测试就是根据上一步列出的可能原因,按照其排列顺序逐个地进行测试,寻找问题的真正原因。这个步骤是个反复过程,需要对所有可能的问题一个一个地进行过滤,一直到发现故障的原因,并通过

13、测试来排除故障。如果故障已经排除,就没有必要再测试其他的原因,但如果没有找到故障所在,就必须把所有的列表都进行分离测试。图10.2给出了它的流程图。对故障进行分离测试时,应该为每一步操作做好记录,同时对改动的文件和系统配置进行备份,以便在需要恢复时可以还原。第10章 网络故障及其处理 图10.2 障分离测试的工作流程第10章 网络故障及其处理 5)分析测试结果,检测网络故障通过上一步的分离测试,对测试结果进行研究,并进行网络故障检测与排除。如果问题已经解决,可以进入下一步的任务;如果问题没有解决,则需要重新开始收集信息,再重复上面的问题,一直到故障被排除为止。6)记录故障排除过程、总结经验每当

14、排除了一个网络故障时,应该记录解决该问题的过程文档。内容包含故障的现象、发生的原因、解决的方法、解决故障时对硬件和系统设置作出的改动等。为下一次故障的排除积累经验和故障排除过程中带来的新的问题作出佐证。第10章 网络故障及其处理 2.替换法替换法替换法,即将怀疑可能造成故障的网络部件用其他已证实正常的网络部件替换,或者将一被怀疑有故障的网络部件加入到正常的网络环境中,由此验证出错部件。当网络系统的故障原因较多且涉及面较广时,可以使用分离法来缩减问题的范围。如问题已经缩小到某种部件或成分,观察其是否有问题,我们可以用替换法,拿一个已确认为正常的部件来替换,检查是否能解决问题。第10章 网络故障及

15、其处理 3.参照法参照法参照法是将网络中的故障部分与能正常工作的部分进行比较,从而发现由于“不同”而得到具体出问题的环节。此方法尤其适用于用户设置和工作站配置等引起的网络故障检测。有时,当已把问题归结到某一个部件上时,可以把它全部替换成“好”的部件,即采用替换法,这样可避免分析过多的问题。如果报告故障的用户很多,则应该从日志着手,分析这些用户的工作站和配置有何不同,这样有利于建立相同的配置。第10章 网络故障及其处理 4.咨询法咨询法 有时,最好解决问题的方法就是找到曾遇到过或可能遇到过同样问题的专家和同行。Internet、硬件技术资料、硬件制造商的技术支持、软件技术支持、杂志和技术期刊与知

16、识库光盘等都是进一步解决疑难问题的手段。向技术支持咨询是排除网络故障不可缺少的好办法。第10章 网络故障及其处理 5.软件检测法软件检测法1)使用设备诊断命令下面以路由器为例来介绍设备诊断命令。(1)show命令。它是一个功能强大的监控和网络维护工具,可以用它来监视路由器的工作与常规的网络操作:判断出现故障的接口、节点与介质;确定网络通信流量及其时间;查看网络硬件与通信设备的状态。(2)debug命令。debug特权EXEC命令可以提供丰富的接口通信流量信息、网路中各节点产生的出错信息、协议诊断信息包,以及其他对网络维护有用的数据。debug命令可以帮助用户分析网络中出现的问题。第10章 网络

17、故障及其处理(3)Ping命令。它用于检查主机的可连接性以及网络的连通性。对于TCP/IP网络,Ping是检查网络连通性的最常用手段。对IP来说,Ping命令发送ICMP回显信息。如果一个工作站接收到了一个ICMP回显信息,它会返回一个ICMP答复回显信息。在网络工作正常时,一般使用Ping命令来观察和记录在正常条件下该命令的工作状态,在以后出现故障时就可以通过与正常工作状态对比来检测和排除故障。下面以Ping命令为例介绍域名解析服务器(DNS)的故障检测。可以键入ping webname来确定DNS服务是否正常工作。如果DNS正在工作,Ping外部主机的结果如下:第10章 网络故障及其处理

18、第10章 网络故障及其处理(4)Tracert命令。它可以检测数据包TTL超时时路由器返回的错误信息,可用于探测信息包传送至目的地途经的路径。同Ping命令一样,在网络工作正常时一般使用Tracert命令观察和记录在正常条件下该命令的工作状态,在以后出现故障时就可以通过与正常工作状态对比来检测和排除故障。下面以Tracert命令为例,首先按名称和IP地址Ping服务器。如果Ping IP地址结果正确,但Ping名称不正确,应当检查工作站的DNS配置或检查DNS服务器。第10章 网络故障及其处理 如果ping IP地址结果不对,跟踪路由地址,如图10.3所示。图10.3 路由跟踪举例第10章 网

19、络故障及其处理 第10章 网络故障及其处理 Tracert的输出显示了所有经过的路由器的信息,当发现Tracert停止时,就能找出最可能的出错地点。例如,在本例中Tracert停在202.120.95.1处,不再到达下一站点(202.120.96.2),那么就说明广域链路出了问题或路由器1出了故障。对202.120.95.1测试成功而对202.120.96.2测试失败说明路由器2工作正常。第10章 网络故障及其处理 2)使用网络管理工具软件(1)网络管理软件。网络管理软件的主要功能有:监视设备的应用环境和接口信息,显示设备的状态,检测并提取网络设备环境的数据。显示和分析两个设备之间的路径,以搜

20、集使用的错误数据。收集网络的历史数据以进行性能趋势和通信流量模式的离线分析。第10章 网络故障及其处理 NNM对于一般的系统平台和网络设备均可自动识别,而开放平台的优势在于集成第三方厂商开发模块后,对于特定的设备将拥有更加丰富的管理功能。例如在安装了CiscoWorks for OpenView之后,Cisco的网络设备在NNM视图中都用特殊的图标来表示,每台路由器和交换机的类型和型号在图中都可一目了然,并且通过菜单中新增加的CiscoWorks命令集对网络设备的端口流量等进行远程监控和管理。第10章 网络故障及其处理 当报警浏览器上显示出主要设备的故障事件时,NNM的关联引擎就能够分析事件流

21、并找到故障的根本原因,能够协助网络管理人员迅速地找到网络故障的根源。NNM的远程用户存取功能提供了从Internet的任何地点存取网络的灵活性。可见,NNM的网络设备状态监控、故障分析和远程用户存取等功能实现了防患于未然的网络管理。第10章 网络故障及其处理(2)远程监控软件。远程监控软件从远程监控代理处搜集并显示信息,查看网络的启动并引起对潜在问题的注意,从任何远程局部网段,或交换连接中获得有助于排除故障的数据。NAI提供的Sniffer Pro是采用网上监听的方式收集过往的数据包,并通过分析这些数据包来获取有关目前网络状况的数据,同时Sniffer Pro还将建立一个特定网络环境下的目标知

22、识库,来帮助网络管理员了解网络的运行状况,为网管人员判断网络问题、管理网络区域提供了非常宝贵的信息。实时监控网络状况是Sniffer Pro的强项,但并不是全部。Sniffer Pro的专家分析系统能够自动检测诸如拒绝链接、吞第10章 网络故障及其处理 吐量降低等多种网络故障征兆,及时阻止其发展成为致命的网络性能问题,并且能够根据当前的网络运行状况提出优化方案,以提高网络的运行效率。Sniffer Pro的专家分析系统主要包括路由器专家分析系统、交换机专家分析系统、数据库专家分析系统、Microsoft专家分析系统、帧中继专家分析系统、网络专家分析系统和ATM专家分析系统等部分。第10章 网络

23、故障及其处理 以前对网络进行安全检测的产品,难以及时发现隐藏在网关、群件和端口等环节的安全隐患,对病毒是一种被动和间断的检测方式,这些不足严重影响了网络的安全。而Sniffer Pro系统对网络具有主动和实时检测功能,当网络性能降低,应用程序运行缓慢时,Distributed Sniffer System/RMON(DSS/RMON)探测器可以找出网络通信瓶颈和造成服务器性能降低的设备的错误配置。在发现问题的同时,及时实施快速隔离,为故障的进一步解决和减少故障涉及范围提供帮助。第10章 网络故障及其处理(3)交换机管理软件。交换机管理软件提供了管理虚拟局域网(VLAN)的功能。对VLAN设计和

24、设置确认给出网络物理结构的精确表示;可获取VLAN中具体设备和连接接口的设置信息,报告配置冲突,确定和排除各个设备的配置故障;能快速检测VLAN交换端口状态的变化。第10章 网络故障及其处理 10.3 排除网络故障的常用工具排除网络故障的常用工具1.数字万用表数字万用表数字万用表是一种检测线缆的基本设备。它可以测量线缆的电压、电流、电阻、电容等物理参数。利用数字万用表可以判断线缆是否断开、是否短接、是否与其他导体短路。2.断路测试盒、断路测试盒、FOX盒和误码率测试仪盒和误码率测试仪断路测试盒、FOX盒和误码率测试仪是用来测量计算机、打印机、调制解调器、信道服务单元、数据服务设备以及其他数字化

25、接口的测量工具。这些设备可以监控数据线状况,分析和控制数据,以及诊断数据通信系统故障。第10章 网络故障及其处理 3.线缆测试器线缆测试器1)线缆测试仪器的精度对布线现场认证使用的测试仪器,其测试精度十分重要。TSB-67标准明确定义了现场测试仪的精度级别,无论是测试基本连接还是通道,作为认证布线的测试仪器必须要达到二级精度。生产厂家给出的精度指标应由独立的认证机构承认。精度一般是有时间限制的,一般来说,测试仪的精度只能保持半年至一年,所以当用户在选择5类线缆这种高精度测试仪器时,购买后要掌握国际标准校正的过程和方法,以保证测试仪器的正确性和权威性。第10章 网络故障及其处理 2)线缆测试仪器

26、的主要功能线缆测试仪有两个主要的功能:一是测试或验证布线的电气传输性能;二是查找布线系统的故障。3)故障诊断线缆测试仪器提供一系列的故障诊断能力来定位已发现的线缆系统故障。表10.2中的第一列列出了在TSB-67的测试中可能出现的链路故障,第二列列出了测试这些故障可能使用的诊断测试方法。第10章 网络故障及其处理 TDx是结合数字脉冲与数字信号处理技术对NEXT进行测试的方法。它能以图形方式显示被测试链路的串扰情况。模拟频率扫描技术测量的是链路整体的NEXT值,因此,测试只能报告该链路上“合格”或“不合格”的结果,而采用TDx技术的好处是测试仪器可以指出链路中较高的串扰信号发生的位置。第10章

27、 网络故障及其处理 表表10.2 故障类型及相应的诊断测试故障类型及相应的诊断测试第10章 网络故障及其处理 4.时域反射仪时域反射仪时域反射仪是一种能定位通信媒介故障的设备,如果电缆(或光纤)中发生断路、短路、卷曲、扭结等故障,可以定位故障发生的大概位置。时域反射仪的工作原理是利用脉冲信号来实现的。时域反射仪向网络上定时发射脉冲信号,这个脉冲信号到达断点或短路点后会反射回时域反射仪,时域反射仪根据该脉冲信号发出到反射回的时间来计算发生故障的距离。光纤是使用光学时域反射计来测量的。光学时域反射计可以精确地测量光纤的长度,定位光纤的故障点,测量光纤的衰减,以及测量连接或连接器丢失等。第10章 网

28、络故障及其处理 5.网络监视器网络监视器网络监视器可连续跟踪通过网络的信息包,给出任一时刻网络行为的历史记录。网络监视器收集信息包的大小、数量、错误的信息包、全部连接的使用、主机数及其MAC地址,主机和其他设备之间通信的详细资料。这些数据同样可以用来建立简档,查找通信流量过载,编制网络扩展计划,探测网络的入侵者,建立基准性能,以及更有效地分配通信流量。第10章 网络故障及其处理 6.网络分析仪网络分析仪网络分析仪是一种功能强大的故障排除工具,用于维护大型的网络。它能对信号进行捕获、解码、发送,通过检查数据帧内部数据来确定网络故障。网络分析仪还可以通过综合网络的配置和工作信息来检测一些故障类型,

29、例如,线路连接问题、网络的瓶颈、网络设置的错误、协议的冲突、应用程序的冲突等。第10章 网络故障及其处理 1)网络分析仪的分类网络分析仪可以分为电缆扫描器和数据包侦错器两种类型。电缆扫描器主要用于检验网络线路的电特性,可以检验任何特定电缆线路是否出现了故障。一些较复杂的扫描器还能监听线路中的信号以查看网络中是否存在物理或数据连接问题。数据包侦错器主要用于监听数据链路传输,它们能够物理地监听并不是发送给它们的数据包。由于数据包侦错器从线路中捕获了整个数据链路的数据包,用户可以使用相关软件来解码这些数据包,查找协议和应用程序方面的问题。第10章 网络故障及其处理 2)网络分析仪的操作大多数网络分析

30、仪具有捕获与解码两种操作方式。(1)捕获。分析仪可以执行一些统计数字的收集工作,包括每一个站的错误数量、每一站传递/接收包的数量以及网络的利用率等。虽然在分析仪上可捕获的数据资源有限,但我们通常并不需要捕获线路中的所有数据。即使真的要捕获所有数据,关心的主要是统计量的收集,而不是真正有兴趣查看数据包中包含的特定内容。根据实际情况,只对特定协议、特定工作站与特定服务器的数据感兴趣。捕获特定的数据包有助于找到某特定问题的解决方案,用户通过分析仪可以得到关于网段的总体概貌。第10章 网络故障及其处理(2)解码。捕获完数据后,在用户能查看数据之前,分析仪将把数据包中的位和字节转换成人们能看懂的形式。即

31、完成MAC、协议、服务等三种类型的转换。(3)网络分析仪的专家模式。一些网络分析仪具有专家模式,它包括在捕获过程中,可以猜测网络有什么错误,查看工作站在响应请求时的延迟,发现IP地址冲突以及其他简单的问题。第10章 网络故障及其处理 3)使用分析仪的技巧(1)每一种分析仪的功能都不一样,应选择最适合的分析仪。(2)筛选数据。筛选数据有几种类型的筛选器可以使用:站筛选器要捕获哪一个工作站或服务器的数据。协议筛选器TCP/IP、IPX/SPX以及NetBEUI。服务筛选器显示哪些服务。通用筛选器在一个数据包中的十六进制值。不是每种类型的筛选器都能被所有的分析仪支持,最好是选择通用筛选器。第10章

32、网络故障及其处理 分析仪可以使用两种方法筛选:捕获前筛选:当不想缓存因无用的数据而溢出时这一方法很有用。捕获后筛选:在已经捕获了有问题的普通数据后进一步研究时,这一方法很有用。第10章 网络故障及其处理 10.4 网网 络络 测测 试试10.4.1 延误时间的测量分析延误时间的测量分析用分析仪分析网络延误时间的一般技术归纳如下:(1)从工作站网段对整个往返时延进行分析。(2)选择源/目的网络地址对进行过滤。(3)对包进行分析,如Ping包、客户机命令/服务器响应包或LLC轮询。(4)对分析仪摘要显示中的应答包使用delta时间。(5)为准确起见,采用接近或小于64字节的包且此时不测量带宽。(6

33、)采集尽可能多的样本。第10章 网络故障及其处理 通过几次取样,可以建立一个基准,即使网络非常繁忙,具有最小增量(delta)时间的样本也很可能最接近真实情况中的响应时间。接着要计算多个采样的平均delta时间,平均时间和最佳事件时间之间的差别取决于服务器与客户机之间所有网络组件的连接。通过每周在设定时间(例如每周一上午10:00)进行计算,可以获得长期的基准和变化趋势。通过该测试获得的基准十分有用,最佳事件响应时间的变动可以反映出网络结构的变化。一方面,帧中继提供商改变指定永久虚电路(PVC)的路径会导致出现较大的最佳事件响应时间。另一方面,最佳事件时间稳定但平均响应时间增加(或减少)反映的

34、是网络用户或应用的变动。第10章 网络故障及其处理 出于一致性的考虑,用户可能会选择运行像Ping这样的简单应用来收集数据。在一个场地,在同一个网络段上的一台工作站(一台路由器向帧中继提供服务)执行Ping命令,同时Ping几个远程路由器。从该工作站的网络段上采集大约一个小时的包,保存起来用作以后的分析。在以后的时间重复这种操作,就可以标出上面提到的帧中继PVC的变动情况。把一个采集过滤器设在工作站的IP地址上,而在工作站上对几个远程路由器做Ping操作,持续几分钟。通过对采集缓冲显示中的一个特殊路由器进行过滤,就能够了解采集期间响应时间的特性。在大负荷的网络中,可能会看到更严重的响应时间波动

35、。第10章 网络故障及其处理 为更进一步说明延误时间,可以把分析仪换个位置或者使用多个分析仪(如图10.4所示),再次对命令和应答包之间的最佳delta时间进行检验,就可以很好地获得延误时间瓶颈与位置之间的关系。在图10.4中,最大的落差发生在分析仪2和分析仪3之间,这两个分析仪分别位于广域网的两侧。第10章 网络故障及其处理 图10.4 用分析仪确认延误时间第10章 网络故障及其处理 10.4.2 吞吐量的测量分析吞吐量的测量分析当用户从服务器上往他们自己的工作站下载文件(或反之),而沙漏(计时器)长时间停止不动时,也会抱怨“网络太慢”。这就需要再次分析文件传送,看看实际吞吐量是好是坏。在这

36、种情况下,首先需要做的事情就是计算理想条件下理论上的吞吐量。如果用的是10 Mb/s以太网,将带宽除以8位(字节),得1 250 000 B/s,也就是吞吐量超过1 MB/s。接着,使用下列常用的步骤迅速获取吞吐量:(1)在工作站和服务器之间的路径上选取任意一个网络段。总的吞吐量不会高于用户和服务器之间最慢链路的吞吐量,所以从何处开始分析都没有关系。第10章 网络故障及其处理(2)对所选的源/目的网络地址对进行过滤。(3)利用摘要显示中的累加时间和累加字节。如果规程分析仪不能显示上述数据,那么可以用绝对时间,根据交替进行文件的读或写的偏移量,计算出这段时间内传送了多少字节。(4)利用文件传送(

37、如FTP、NFS、NCP、Packet Burst或SMB)进行分析。(5)为了准确地确定平均和可能的最大吞吐量,使用接近主要网络段中最大MTU的包。(6)对少量包进行多次采样。第10章 网络故障及其处理 最后一步是至关重要的。换句话说,每次计算超过2030个连续包的吞吐量,以便查看在短时间间隔内最佳的吞吐量是多少。选取从文件打开到文件关闭的整个间隔,可以得出总的平均吞吐量。同计算延误时间一样,最佳情况的“突发”值与平均值之间的差别取决于服务器与工作站之间所有网络组件的竞争。每周在固定时间进行这种测试可以得出长期的变化趋势。第10章 网络故障及其处理 假定对10 Mb/s以太网网络段上用户的一

38、个文件传输进行分析并得出平均吞吐量约为150 KB/s。由于这个吞吐量低于理论上的最大值1250 KB/s,几乎就是理论值的1/10,所以用户难免要抱怨。如果较短时间间隔的最佳吞吐量达到800 KB/s,那么许多用户对网络资源的利用率就很高,可以达到局域网或服务器的使用率。另一方面,如果小间隔的最佳情况仅仅是160 KB/s,那么很可能是网络中某个地方的通道带宽较窄。如果查询网络文档,发现服务器与用户之间有一个满负荷的T1存在,那么,160 KB/s实际上是相当不错的。大体上来看,8 bit/B 160 KB/s=1.25 Mb/s,或者说为T1带宽(1.544 MB/s)的78%第10章 网

39、络故障及其处理 如果在这个性能级别上,用户经常抱怨远程文件传送太慢,那么,解决办法就是增加网络带宽,当然这也取决于远程传送大文件的频繁程度。也可以告诉用户,不要期望远程文件传送和本地文件传输同样快。客户机自身的故障也会导致吞吐量降低,使用如下方法就可以确认这一点。第10章 网络故障及其处理 首先,把TCP窗口增加到64 KB,允许NT服务器在给工作站发送一个带打开窗口的TCP应答之前可以发送最多64 KB的数据。由于用户的硬盘驱动器非常慢,在64 KB的数据块写到硬盘之后才能打开TCP窗口。结果是非常快地从服务器发来数据,然后服务器等待,接着又很快地从服务器发来数据,再等待。虽然峰值吞吐量已接

40、近以太网的带宽,但平均吞吐量实际上反而改善了,因为同时要在服务器和客户机之间进行反复的读写操作,有时候还是要追求网络的“整体最佳”。第10章 网络故障及其处理 10.4.3 基本的线缆测试基本的线缆测试在诊断电缆布线方面的潜在问题时,主要应该考虑电缆布线出现问题的原因。由于外界的电磁泄漏或内部信号的反射,造成电缆线路上出现了不应该有的信号时,或者当电缆对信号的衰减达到了信号消失的程度时,会导致网络发生故障。噪声信号可能通过两个途径进入电缆:(1)由于接触到某些能产生噪声的设备,噪声信号就会直接进入电缆。产生噪声的设备包括电机、配线、计算机设备以及使用或携带电能的任何设备,所有此类设备都会产生一

41、定的电噪声。第10章 网络故障及其处理(2)较大的噪声源产生感应噪声(电信号通过空间耦合)。如果电缆中阻抗不匹配,没有设置端接器,或者电缆严重弯曲,就会引起信号反射。上述噪声源都会在网络线路内部产生噪声。当信号通过阻抗极高的地区时,信号就会衰减。当电缆反复折弯,造成电导体断裂或接近断裂,或者接触点出现腐蚀,或者接触面存在污物时,都会导致信号衰减。如果在分析仪中记录了一个网段上出现了介质方面的问题,或者SNMP问题,例如以太网上的CRC错误,或令牌环网上的线路出错,那么线缆测试仪可以帮助用户进行准确的故障定位。第10章 网络故障及其处理 基本线缆测试仪检查短路、开路和线对的分离,并根据时间域反射

42、(TDR)测试计算线缆的长度。较高级的功能包括测试线缆近端串扰、探测线对的分离、测试线缆噪声或者信号与噪声之比。短路的线缆在其内部有一条或多条线相互交叉。开路的线缆在两端没有端接器,比如以太网同轴线上没有端接器,或者5类线的RJ-45连接器在集线器端口上接触不良。当使用10Base-T或100Base-T收发器或收发器内嵌的NIC卡时,会注意到有一个“链路集成”指示灯,通常是绿色的LED。收发器发送一个定期的链路脉冲,用于探测线对的另一端。第10章 网络故障及其处理 当链路的LED灯亮时,只是说明链路接收方是良好的,还需要检查线缆的另一端及其连接,以便确定链路另一端的LED灯也是亮的。如果链路

43、的一端是好的,另一端也是好的,而工作站接收不到它发送信息的任何响应,则最简单的方法是检查两端的LED灯亮否,查看线缆连接的方法。第10章 网络故障及其处理 较复杂的测试TDR是在一根线缆中测试一个脉冲及其反射之间的时间延迟,这根线缆没有端接器来吸收信号。很明显,这个测试需要从集线器上拔下五类线的远端,或者,如果使用同轴电缆,则去掉另一端的端接器。假定告诉线缆测试仪要测试的线缆类型,TDR测试在两英尺(1英尺=30.48厘米)内通常很精确。这条信息对于设置特定线缆的传播速率(信号相对于光速的传输速度)是很必要的。对于不同厂家产品来说,测试结果可能会有点不同。对于“相同类型的”线缆(如3类线)来说

44、,不同厂家的产品之间的差异也可能很小。TDR测试的目的是为了得到一个大概的数字,这样就知道在布线时是否超过了最大的推荐距离。需要确定线缆的长度时,TDR测试也很方便。第10章 网络故障及其处理 分离线对(Split Pair)是指发送和接收信号在单根线上传送而没有对应的线(即绕在双绞的第一根线上的第二根线)来帮助过滤掉外界的噪声和来自相邻线对的串扰这种情况。当不正确地连接一个接线柱,或者当把那些RJ-45连接器连接到不正确的线上时,就常常出现分离线对的情况。568-A认证5类线应该总是直连的,即同样颜色的线在两端接法相同。不良的NEXT常常是分离线对的指示。第10章 网络故障及其处理 图10.

45、5说明的是使用RJ-45连接器时适用于各种技术和标准的正确线对接法。值得注意的是第二个线对总是连接到第三根针和第六根针上。这是以太网的接收线对,是令牌环的发送线对(很明显,我们不能在一个连接器上既支持以太网也支持令牌环,但仍然要满足整个标准)。常见的错误是把第一对线连接到第一根和第二根针上(目前是对的),然后第二个线对连接到第三根和第四根针上(错误的),如图10.6中说明的那样,就会导致以太网和令牌环中的分离线对。第10章 网络故障及其处理 图10.5 常见的RJ-45连接器的接法和颜色标记第10章 网络故障及其处理 图10.6 不正确的连接可能导致分离线对的问题第10章 网络故障及其处理 半

46、双工以太网要比分离线对的令牌环容错能力更好一些。这是因为令牌环的工作方式是在接收和发送线对上总是有一个信号,即使在没有数据发送的时候。如果没有帧发送,则令牌会用特殊的信号在环上流动,这个信号叫“空闲”位,在令牌之后发送。由于在令牌环的两个线对上总有一个信号,所以,在两个线对之间就会有很大的干扰机会。对于分离线对来说,干扰机会会更多,因为没有对应的线绕在正在发送数据的线外。对于半双工的以太网,接收方总是空闲的,除非有冲突。对全双工的以太网,正确的连接更是关键,因为可能会使用两个线对同时接收和发送帧。第10章 网络故障及其处理 即使线对连接正确,串扰也是不可避免的,尤其是在100 Mb/s这样高的

47、数据速率的情况下。因此,能够测量近端串扰(NEXT)是很重要的。针对不同的LAN速率和线缆类型,NEXT需要在不同的频率下进行测试,所以要保证线缆测试仪具有很好的灵活性。NEXT是通过在一个线对上发送信号,测量一个被动线对接收到这个信号或串扰的程度。这两者之间的差异表现在NEXT值上,通常用分贝(dB)表示。这个值越小越好。如果对于一个给定线对来说测量结果是相同的(即有0 dB的差异),那么,被动线对百分之百地传送所发送的信号。第10章 网络故障及其处理 也应该测量线缆两端的NEXT,因为信号在线缆上传送时会受到减弱(损耗)的影响。在传送时,另一个线对很可能收不到较弱的信号,这就是要在信号最强

48、的地方、在近端线缆测试仪能够到达的地方测量NEXT的原因。如果在数据发送过程中有干扰,例如过多的线缆噪声,那么,在以太网中可能会出现CRC错误(也叫FCS或帧校验序列错误);在令牌环上会出现线路错误(线路错误是指由插入到环中的一个工作站探测到的CRC不匹配错误)。如果怀疑线缆上有噪声,那么,带有噪声测试功能的线缆测试仪将是重要的测试工具;否则,就可能会通过更换怀疑有问题的线缆或者再换一种方法使用这条线缆来纠正这个问题。通常,在纠正这个问题之前或之后,要保证用一台好的线缆测试仪或规程分析仪来检查CRC计数。第10章 网络故障及其处理 干扰并不总是CRC错误的原因。无论何时,当冲突扩展到以太网帧头

49、之外时,以太网中的冲突通常会显示CRC包错误,也就是说,错误发生在包头中。第10章 网络故障及其处理 10.5 网络故障的解析举例网络故障的解析举例10.5.1 服务器与局域网交换故障的检测与排除举例服务器与局域网交换故障的检测与排除举例1.服务器在安装网卡后不能启动服务器在安装网卡后不能启动(1)可能的原因:网卡与服务器其他板卡、监视器或端口发生冲突。故障解决方法:重新启动服务器,按提示进入BIOS设置;查看机器各个接插板卡使用的端口地址和中断号,注意是否与网卡的设置相冲突;若发现有冲突,改变网卡的配置,或在BIOS设置屏中改变其他接口板卡的配置。第10章 网络故障及其处理(2)可能的原因:

50、网卡与线缆连接不正确。故障解决方法:检查服务器网卡是否与线缆正确连接,如果网卡与线缆连接不好,将导致文件服务器挂起。将文件服务器网卡至少和一台工作站相连。完成后重新启动文件服务器,即可正常。第10章 网络故障及其处理 2.服务器在安装最后卷后中止服务器在安装最后卷后中止可能的原因:服务器网卡安装或配置不正确。故障解决方法:检查网卡设置,如果设定值与网卡配置不一致,则更改网卡设定值;如果网卡设置与实际配置一致,则关闭服务器,拔下网卡,然后再把网卡正确地插入服务器插槽;在确认网卡已正常安装的前提下,仍未解决问题,则检查服务器网卡与线缆的连接是否牢固与正确;如果问题仍存在,在服务器和任一台工作站上运

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报