您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第11章局域网故障诊断、分析与排除技术
11.1局域网故障概述11.2局域网故障诊断技术11.3局域网故障分析与排除技术第11章局域网故障诊断、分析与排除技术11.1局域网故障概述11.1.1局域网故障分类根据网络故障的性质可把网络故障分为物理故障与逻辑故障,也可以根据网络故障的对象把网络故障分为线路故障、路由故障和主机故障。1.按照网络故障的不同性质划分(1)物理故障物理故障指的是设备或线路损坏、插头松动、线路受到严重电磁干扰等情况。(2)逻辑故障逻辑故障中最常见的情况就是配置错误,就是指因为网络设备的配置原因而导致的网络异常或故障。逻辑故障的另一类是一些重要进程或端口关闭,以及系统的负载过高。2.根据故障的不同对象划分(1)线路故障:线路故障最常见的情况就是线路不通,诊断这种情况首先检查该线路上流量是否还存在,然后用ping检查线路远端的路由器端口能否响应,用traceroute检查路由器配置是否正确,找出问题逐个加以解决。(2)路由器故障:事实上,线路故障中很多情况都涉及到路由器,因此也可以把一些线路故障归结为路由器故障。检测这种故障,需要利用MIB变量浏览器,用它收集路由器的路由表、端口流量数据、计费数据、路由器CPU的温度、负载以及路由器的内存余量等数据,通常情况下网络管理系统有专门的管理进程不断地检测路由器的关键数据,并及时进行报警。值得注意的是:路由器CPU温度过高是十分危险的,因为这有可能会导致路由器的烧毁;而路由器CPU利用率过高和路由器内存余量太小都将直接影响到网络服务的质量。解决这种故障,只有对路由器进行升级、扩大内存,或者重新规划网络拓扑结构。(3)主机故障:主机故障常见的现象就是主机的配置不当,像主机配置的IP地址与其它主机冲突,或IP地址根本就不在子网范围内,由此导致主机无法连通。主机的另一故障就是安全故障。发现主机故障一般比较困难,特别是别人恶意的攻击,一般可以通过监视主机的流量、扫描主机端口和服务来防止可能的漏洞。11.1.2局域网故障诊断步骤第一步:识别故障现象分析网络故障时,首先要清楚故障现象。要确定故障的具体现象,然后确定造成这种故障现象的原因和类型。例如,主机不响应客户请求服务,可能的故障原因是主机配置问题、接口卡故障或路由器配置命令丢失等。第二步:对故障现象进行描述收集故障原因的信息。向用户、网络管理员、管理者和其他关键人物提一些和故障有关的问题。广泛的从网络管理系统、协议分析跟踪、路由器诊断命令的输出报告或软件说明书中收集有用的信息。第三步:制定诊断计划,列举可能导致错误的原因根据收集到的故障信息情况进行故障原因的分析。可以根据有关情况排除某些故障原因。例如,根据某些资料可以排除硬件故障,把注意力集中在软件原因上。对于任何机会都应该设法减少可能发生的故障原因,以便尽快的策划出有效的故障诊断计划。第四步:根据分析出的故障原因,建立一个诊断计划开始仅用一个可能的故障原因进行诊断活动,这样可以容易恢复到故障的原始状态。如果一次同时考虑多个故障原因,试图返回故障原始状态就困难得多了。第五步:排除故障执行故障排除预案,认真做好每一步测试、观察和处理,直到故障症状消失。第六步:每改变一个参数都要确认其结果。分析结果确定问题是否解决,如果没有解决,继续下去,直到彻底解决问题。11.2局域网故障诊断技术11.2.1物理层诊断技术物理层是OSI分层结构体系中最基础的一层,它建立在通信媒体的基础上,实现系统和通信媒体的物理接口,为数据链路实体之间进行透明传输,为建立、保持和拆除计算机和网络之间的物理连接提供服务。物理层的故障主要表现在设备的物理连接方式是否恰当;连接电缆是否正确;MODEM、CSU/DSU等设备的配置及操作是否正确。确定路由器端口物理连接是否完好的最佳方法是使用showinterface命令,检查每个端口的状态,解释屏幕输出信息,查看端口状态、协议建立状态和EIA状态。11.2.2数据链路层诊断技术数据链路层的主要任务是使网络层无须了解物理层的特征而获得可靠的传输。数据链路层为通过链路层的数据进行打包和解包、差错检测和一定的校正能力,并协调共享介质。在数据链路层交换数据之前,协议关注的是形成帧和同步设备。查找和排除数据链路层的故障,需要查看路由器的配置,检查连接端口的共享同一数据链路层的封装情况,每对接口要和与其通信的其他设备有相同的封装。通过查看路由器的配置检查其封装,或者使用show命令查看相应接口的封装情况。11.2.3网络层诊断技术网络层提供建立、保持和释放网络层连接的手段,包括路由选择、流量控制、传输确认、中断、差错及故障恢复等。排除网络层故障的基本方法是:沿着从源到目标的路径,查看路由器路由表,同时检查路由器接口的IP地址。如果路由没有在路由表中出现,应该通过检查来确定是否已经输入适当的静态路由、默认路由或者动态路由,然后手工配置一些丢失的路由,或者排除一些动态路由选择过程的故障,包括RIP或者IGRP路由协议出现的故障。例如,对于IGRP路由选择信息只在同一自治系统(AS)的系统之间交换数据,查看路由器配置的自治系统的匹配情况。网络故障的分类硬件故障是指网络设备或通信媒体的故障软件故障是指设置上的问题内网故障是指内部局域网的故障外网故障是指与公司外部或Internet连接的故障一般网络故障可以分为硬件故障,软件故障;或者分为内网故障,外网故障。网络故障分层排除法OSI的层次结构为管理员分析和排查故障提供了非常好的组织方式。由于各层相对独立,按层排查能够有效地发现和隔离故障,因而一般使用逐层分析和排查的方法。通常有两种逐层排查方式:是从低层开始排查,适用于物理网络不够成熟稳定的情况,如组建新的网络、重新调整网络线缆、增加新的网络设备;是从高层开始排查,适用于物理网络相对成熟稳定的情况,如硬件设备没有变动。在实际应用中往往采用折衷的方式,凡是涉及到网络通信的应用出了问题,直接从位于中间的网络层开始排查,首先测试网络连通性,如果网络不能连通,再从物理层(测试线路)开始排查;如果网络能够连通,再从应用层(测试应用程序本身)开始排查。网络故障分层排除法例如,这里要测试网络能否正常通信。通常从ping远程计算机开始(例中在主机A上ping主机B),成功说明系统和网络正常,失败说明主机离线或网络故障。失败后再ping同一子网的网关(例中为192.168.1.1)来确认主机A是否能够连接到路由器。失败后再ping环回地址127.0.0.1来确认TCP/IP协议软件是否有问题,如果有问题,需要重新安装TCP/IP协议软件。也可以采用另一种步骤,从ping环回地址127.0.0.1开始,失败说明TCP/IP协议软件安装有问题,如果成功再ping同一子网的网关,如果成功再ping其他网关(路由器)逐步排查网络各个环节,直到最后ping远程主机。只要成功地ping到远程主机,可以判断网络问题一般发生在更高层次。网络故障分层排除法物理层:采用替换法或专门的线缆测试仪,没有测试仪的可通过网络设备(网卡、交换机等)信号灯进行简单的目测。数据链路层:相对于其他的协议层,数据链路层出现问题的可能性不大,对于TCP/IP网络,可以使用简单的arp命令来检查MAC地址(物理地址)和IP地址之间的映射问题。网络层和传输层是最容易出现问题的两层,路由配置容易出现错误,可通过route命令来测试路由路径是否正确,也可使用ping命令来测试连通性。对于复杂的问题,也可以通过专门的协议分析器(如微软提供的网络监视器),专业的协议分析软件snifferpro等,这些协议分析器具有很强的检测和排查能力,能够分析链路层及其以上层次的数据通信。应用层的问题,则需要对程序进行检查,或检查有没有什么其他程序影响到应用层本身工作。网络故障排除步骤第一步:全面收集信息,并分析故障现象全面了解故障的情况,并详细询问相关细节,可以请故障发生时操作人员描述正常运行时的情况,如果有可能的话,亲自去验证一下所出现的问题。看是否有正常的功能不见了,还是有异常的反应?检查一下在故障发生之前是否对该节点或是网络进行了改动。第二步:定位故障范围通过第一步全面的收集的信息分析,可以将故障范围缩小到一个网段或节点。基于所作的分析,判断故障是否与一个网段有关,还是局限于一个节点。缩小故障范围是解决的开始。例如当某台计算机发生无法上网的故障时,管理员可以询问其他用户是否也同样出现了这一问题,如果所有的用户都出现这一现象,则说明故障不在用户网络这端,在出口网络设备或其他设备上。网络故障排除步骤第三步:故障隔离如果故障影响整个网段,那么就通过减少可能的故障源来隔离故障。除两个节点外断开其它所有的节点。如果这两个节点能正常通讯,再增加其它节点。如这两个节点不能通讯,就要对物理层的有关部分,如电缆的接头、电缆本身或与它们相连的Hub和网卡等进行检查。如果故障能被隔离至一个节点,可以更换网卡,使用好的网卡驱动程序(绝不能使用该节点现有的网络软件或配置文件),或是用一条新的电缆与网络相连。如果网络的连接没有问题,那么检查一下是否只是某一个应用有问题。使用相同的驱动器或是文件系统运行其它的应用程序。与其它节点比较配置情况,试用应用程序(同样不要使用现有的软件或配置文件)如果只是一名用户出现使用问题,检查涉及该节点的网络安全系统。检查是否对网络的安全系统进行了改变以致影响该用户。是否删除了与该用户安全等级相同的其他用户?该用户是否被网络中的一个安全组所删除?是否某项应用被移到网络中的其它部分?是否改变了系统的注册方法或是改变了该用户的注册方法?比较该用户与其他执行相同任务的用户。网络故障排除步骤第四步:排除故障一旦确定了故障源,那么识别故障类型是比较容易的。对于网络硬件设备来说,最方便的措施就是简单地更换,对损坏部分的维修可以以后再进行。记住:“尽可能迅速地恢复网络的所有功能是故障诊断目的。”有两种办法可以解决软件故障。第一种是,重新安装有问题的软件,删除可能有问题的文件并且确保你拥有全部所需的文件。这也是保证第二种方法得以顺利实施的好办法,即对软件进行重新的设置。如果问题是单一用户的问题,通常最简单的方法是整个删除该用户然后从头开始,或是重复必要的步骤,使该用户重新获得原来有问题的应用。比无目标地进行检查,逻辑有序地执行这些步骤可以更快速地找到问题。网络故障排除步骤第五步:检验故障是否被排除请操作人员测试一下故障是否依然存在,这可以确保是否整个故障都已被排除。只是简要地请用户按正常方法操作有关网络设备即可,同时请用户快速地执行其它几种正常操作。有时解决一个地方的问题会引出别处的问题;有时问题是解决了,但可能会掩盖其它故障。常用网络命令介绍1.计算机网络故障排除常用命令.利用Arp工具检验MAC地址解析•利用Hostname工具查看主机名•利用Ipconfig工具检测网络配置•利用Nbtstat工具查看NetBIOS使用情况•利用Netstat工具查看协议统计信息•利用Ping工具检测网络连通性•利用Telnet工具进行远程管理•利用Tracert进行路由检测•利用nslookup进行DNS服务器测试利用Arp工具检验MAC地址解析Arp(AddressResolutionProtocol):地址解析协议。Arp–a:显示本机arp缓存内容Arp–d:清空本机arp缓存内容Arp–s:在本机添加一条静态缓存利用Hostname工具查看主机名Hostname:显示本机的主机名称利用Ipconfig工具检测网络配置•Ipconfig/all:显示本机TCP/IP配置的详细信息;•Ipconfig/release:DHCP客户端手工释放IP地址;•Ipconfig/renew:DHCP客户端手工向服务器刷新请求;•Ipconfig/flushdns:清除本地DNS缓存内容;•Ipconfig/displaydns:显示本地DNS内容;•Ipconfig/showclassid:显示网络适配器的DHCP类别信息;•Ipconfig/setclassid:设置网络适配器的DHCP类别。
本文标题:第11章局域网故障诊断、分析与排除技术
链接地址:https://www.777doc.com/doc-713462 .html