时间:2022-10-02 09:42:37
序论:写作是一种深度的自我表达。它要求我们深入探索自己的思想和情感,挖掘那些隐藏在内心深处的真相,好投稿为您带来了七篇网络故障范文,愿它们成为您写作过程中的灵感催化剂,助力您的创作。
关键词:网络故障;故障检测;故障定位;故障诊断;专家系统;数据挖掘;神经网络
中图分类号:TP393.06
随着计算机、通信以及互联网技术的飞速发展及应用,网络作为一种重要的工具,在军事、政治、经济和科研等诸多领域起着越来越重要的作用,已经成为社会生产和生活必不可少的一部分。与此同时,网络的规模和复杂性不断增大,一旦网络发生故障,如果不能在有效时间内对网络故障进行诊断与修复,将会造成巨大的损失,甚至严重威胁社会的安全与稳定,因此对网络故障诊断技术进行研究具有越来越重要的应用价值和现实意义。
1 网络故障诊断一般过程
通常来说,网络故障诊断是以网络原理、网络配置和网络运行的知识为基础,根据网络出现的故障现象,并使用专门的网管理和检测工具以获取告警信息进而对网络中出现的故障进行诊断、恢复以及预测的过程,一般可分为以下五个部分[1]:
(1)故障检测,即网络故障告警信息的获取。网络发生故障时,通过主动轮询或异步收集方式,对网络中的相关设备或服务的相关告警信息、设置和性能参数,状态信息等进行收集和分析,及时发现网络出现的故障及问题。
(2)故障定位,即定位故障源。对故障检测阶段收集的海量告警数据进行分析和处理,在网络中找出故障,为下一步的故障原因的诊断提供依据。
(3)故障原因的诊断,即查找故障产生的根源。根据故障定位的结果综合运用各种规则进行系统的推理,快速的找到故障产生的原因或者最可能的原因。
(4)故障修复。根据网络故障诊断结果修复网络故障,恢复网络的正常运行。
(5)故障预测,即根据先验知识和监测数据预测网络可能发生的故障。
其中故障检测,故障定位,故障原因诊断是必不可少的三个步骤,下面将重点对上述三个步骤进行详细的介绍。
2 网络故障检测
通常计算机网络通过以下两种方式收集信息,通过分析收集到的信息来检测故障[2]。
(1)Trap机制。在网络中每一个被管设备中都要运行一个程序以便和管理站中的管理程序进行通信。
(2)主动轮询。网络中发生故障的被管设备或服务主动向网络管理系统发出告警信息,能够及时发现网络中的故障,网络管理系统还需通过主动轮询这种方式了解与网络性能密切相关的信息,并对这些影响网络性能信息设置阈值,来判断网络性能,超过设定阈值也会触发事件。
3 网络故障定位
网络系统中,一般通过监测被管设备或服务等各种方法获取大量原始告警数据或历史积累信息,这些数据往往由于通信系统的复杂性、网络结构异构性、噪声、外界因素、因果关系等原因而具有相当大的不确定性和不精确性,导致故障症状和故障原因都存在非线性映射关系,需要利用关联技术对数据进行处理和分析才有效的进行故障定位[3],目前常用的故障定位技术主要有下面几种:
3.1 基于人工智能的故障定位技术
3.1.1 基于规则的推理技术
基于规则的推理(Rule-based Reason,RBR)是最简单的关联技术,已被用于多种构架。一般而言,基于规则的系统由三个组成部分组成,如图1所示。
(1)推理引擎,主要提供解决问题所需要的策略。
(2)知识库,提供和定义与问题相关的规则和专家知识。
(3)工作内存,主要提供解决问题所需要的数据。
在基于规则的推理的网络故障定位系统中,知识库充当一个专家的角色,利用从人类专家获取专家积累的经验和知识,这些知识主要包括对网络问题的定义以及当某一特定问题发生时,网络故障定位系统需要执行的操作。工作内存主要是利用具体的网络协议对网络中的被管设备或服务进行监测,得到有关被管设备或服务的各种信息。在对网络故障进行定位时,推理引擎与知识库共同合作,将监测得到的网络中被管设备或服务的状态信息与知识库中定义好的条件部分进行比对,根据条件满足与否,来进行网络故障的定位。
基于规则的网络故障定位系统,由于无需对专家系统的具体结构和操作细节进行深入了解,从而具有结构简单等诸多优点,并且实现起来比较简单,非常适用于小型系统。但是基于规则的网络故障定位系统在匹配规则时,需要网络状态与知识库中的规则条件精确匹配,否则将推出整个推理过程,无法定位故障,并且规则存在不易维护性和指数增长性,所有这些缺点决定了基于规则的网络故障定位系统不适用大型系统。
3.1.2 基于模型的推理技术
基于模型的推理(Model-based Reason,MBR)是建立在面向对象上的基础之上,利用现有的专家经验和知识,将具体的目标系统中的实体都模型化诊断对象,并且明确地表现出现实目标系统中对象之间存在的各种关联关系,再根据系统模型对具体的目标系统的行为进行推测。由于通常情况下,具体的目标系统与理想的系统模型之间存在差异性,因此基于模型的推理的专家系统需要对推测的行为和目标系统的实际行为进行不一致诊断,以确定具体目标系统中的故障根源。
为了更好地说明基于模型的推理专家系统的工作流程,文献[4]使用一个物理模型和对应的对等模型分别如图2、3所示的网络系统。网络系统按一定的周期,有规律的向图2中的被管设备发送ping命令以监测网络系统中的被管设备是否运行正常。管理系统和被管设备之间通过一个模型对象实现彼此之间的相互通信,具体来说,如图2所示,系统中的集线器模型向被管设备集线器发送ping命令,路由器模型则向被管设备路由器发送ping命令。当目标网络发生故障时,如果故障发生在集线器1,则集线器1模型可以将其发现并且识别出来,如果集线器1模型连续3次向被管设备集线器1发送ping命令,在3次响应超时以后,集线器模型1根据现有的网络现象推测被管设备集线器1有可能发生故障,或者说目标系统中的故障位于集线器1。集线器1模型则会在确定故障并正式发送告警信息之前,集线器1模型将分析自身与图2中其他被管设备的模型之间的关系以此来确定其是否应该询问网络中路由器模型,如网络中的路由器模型返回的是相应的被管路由器设备工作处于正常状态,则集线器1触发警报。
3.1.3 基于范例的推理技术
基于范例的推理(Case-based Reason,CBR)故障定位技术与前面的基于规则推理技术和基于模型推理技术相比具有很大的差异性,主要因为基于范例的推理技术的思想源于人类现实生活,主要根据过去积累的实际经验或经历,利用类比的推理方法对现有的新问题做出相似的解答,然后根据新问题与旧问题之间的差异对解答进行修改从而得到新问题的完全解答。基于范例推理的网络故障定位技术主要由四个部分组成,检索 (Retrieve)、复用(Reuse)、修正(Revise)、保存(Retain),简称4R过程。
基于范例推理的故障定位技术与基于规则推理的故障定位技术相比,由于在基于范例推理的故障定位技术中检索只是基于对案例的部分匹配,而基于规则推理的故障定位技术则是完全匹配,因此基于范例推理的故障定位技术对网络配置变化的适应度更好,更适用于问题的总体解决方案。
3.2 模型遍历技术
模型遍历技术(Model traversing techniques)是一种构建网络故障传播模型的方法,该方法在构建故障传播模型时,主要根据网络在运行时各种被管对象之间的相互关系,并且按照从引起事件的被管对象开始的顺序进行构建。该方法主要适用于网络中被管对象之间的相互关系类似于图形,并且一般情况下较容易获取的情况,并且在系统配置变化较频繁时该方法的鲁棒性很好。模型遍历技术主要具有两大特点,事件驱动和事件关联,所谓事件驱动是指在一个故障症状报告到来之前,系统一直处于等待故障症状状态;事件关联则是确定两个故障症状是否来源同一个事件源。
一般情况下,模型遍历技术需要在其事件报告中明确标识网络系统中故障的征兆类型、征兆目标等相关信息,如果网络系统中出现故障征兆,且不妨用si来表示该故障征兆,当si的目标和si来源相同,则说明si是一个次要征兆也就说明某些告警信息可以被忽略。模型遍历技术的整个处理可分为以下3步:
(1)首先,对网络中的每个事件,依据网络在运行时各种被管对象之间的相互关系对其构建一个和事件源相关的对象图。
(2)当给定的两个事件的对象图相交时,此时说明两个图至少包含同一个对象,则认为这两个对象图的事件源是关联的。
(3)当给定三个故障症状si,sj,sk,其中si,sj相互关联,sj,sk相互关联,则根据故障症状的传递性可知si是一个次要的故障症状。
4 网络故障原因诊断
(1)基于信号处理方法。该方法主要是依据信号模型,直接对网络系统中的可测信号进行分析与处理,并通过提取可测信号的频率等特征值,对网络中存在的故障原因进行诊断。
(2)基于解析模型的方法。基于解析模型的方法主要依据数学模型和数学方法来进行故障原因的诊断,在诊断时需要建立对象的精确数学模型。
(3)基于知识检测的方法。与基于解析模型方法相比,此方法最大的特点在于其并不需要对象的精确数学模型就可以对网络中的故障原因进行诊断。
下面主要介绍几种目前国内外研究学者研究比较多的基于知识检测的方法,基于专家系统故障原因诊断方法和基于模糊理论故障原因诊断方法以及基于BP神经网络故障原因检测方法。
4.1 基于专家系统故障原因诊断方法
基于专家系统故障原因诊断系统主要是利用人类专家的经验和历史积累诊断数据,使用一定的方法将其转化为系统能够识别的规则存在专家系统的知识库中。当网络中出现故障时,诊断系统利用专家系统知识库中的规则,对发生故障网络中的被管对象的各项性能参数进行处理与分析以正确的确定网络故障发生的具体原因[5]。组成由人机接口、推理机、知识库等六部分组成:
目前,国内外学者公认的专家系统瓶颈是知识获取问题,因为专家系统在诊断过程中主要依赖于从人类专家领域内获取的知识、经验和以往诊断数据,而这些获取起来途径有限,操作起来具有一定的局限性和复杂性。另外,专家系统在实时性和学习能力等方面也存在一定的局限性,因此目前通常将专家系统同其他方法相结合以提高专家系统在这些方面存在的局限性和不足。
4.2 模糊故障诊断方法
很多时候,网络中的故障与系统得到的网络现象之间存在非线性的映射关系,这种非线性的映射关系很难用确定的数学公式或者模型来刻画,相应的在故障原因诊断时,很难给出故障的精确原因。相反,只能给出故障发生的可能原因。对于这种存在一定模糊性的问题,可以使用模糊逻辑来解决。
目前使用的比较多的是向量识别法,其诊断过程可分为以下3步:
首先,需要根据网络中的故障与表征网络故障的数据,建立二者之间的关系,通常用关系矩阵R来表示。
其次,对需要诊断的目标网络系统(对象)进行状态检测,提取相关的特征参数以构建特征向量矩阵X。
最后,根据模糊理论和矩阵理论,求解前面两步构建的关系矩阵方程Y=X・R,得到关系矩阵方程的解Y,再根据隶属度等原则,对目标网络系统的故障向量Y进行处理,得到故障的原因。
从上述诊断过程可知,在模糊故障诊断中,正确的进行故障原因诊断的前提是建立关系矩阵R、隶属函数、特征值向量X,而这些矩阵、函数、向量的建立是人为构造而成,难免具有一定的主观性,并且由于该模糊诊断方法对特征元素的选取也有一定的要求,所以两者若处理不当,会导致该方法的诊断结果精度严重下降甚至完全错误。
4.3 BP神经网络诊断方法
由于人工神经网络的这些特性以及网络中故障与征兆之间有可能存在的非线性映射关系,使得人工神经网络在网络故障诊断中大有用武之地。目前,人工神经网络已经大量应用在网络故障诊断领域。BP神经网络是常用的人工神经网络模型[6]。
BP神经网络故障诊断分为训练和诊断两个阶段:
(1)训练阶段。BP神经网络对样本进行训练,以选定网络结构和规模,确定网络总层数、各层神经元数。借助BP学习算法,将原始网络收集到的故障样本的特征参数作为BP神经网络输入样本集,以与之对应的网络故障原因编码为BP神经网络的输出,以此对BP神经网络进行训练。
(2)故障诊断阶段。主要对待检测对象的故障样本进行特征提取和归一化处理,然后输入到BP神经网络进行诊断输出诊断结果,整个过程分为以下4个步骤:1)故障样本集预处理。2)BP网络结构设计。3)训练BP神经网络。4)故障诊断。
5 结束语
本文对网络故障的概念以及基本过程进行了概述,重点对当前网络故障中的故障检测、故障定位、故障诊断的关键技术及方法进行了研究和总结归纳,对开展网络故障诊断技术研究具有一定的指导意义。
参考文献:
[1]王成等.网络故障诊断技术研究[J].科技信息,2011(11).
[2]陈琳.一种网络环境中的故障诊断模型[J].北京航空航天大学学报,2004(11).
[3]张燕.网络故障诊断关键技术[J].电脑知识与技术,2009(31).
[4]李千目.战略互联网智能诊断技术研究[D].南京理工大学,2005.
[5]吴晓知,李兴明.网络故障管理专家系统中知识库的构造[J].微计算机信息,2008(06).
[6]戚涌,刘凤玉.基于BP神经网络的网络智能诊断系统[J].微电子学与计算机,2004(10).
关键词:光路传输
故障现象:一辆2011年产宝马740Li轿车,车型为F02,搭载N63发动机,行驶里程2万km。用户反映该车中央显示器黑屏。
检查分析:维修人员试车发现,该车除显示器黑屏外其他系统工作正常。通過故障诊断仪查看网络图(图1),发现网络中光纤局域网部分的网络传输存在异常。
光纤局域网是通過光路来传送数据的,各控制单元之间的数据总线采用光路串联方式连接。而对串联方式而言,任何地方出现断点的话,整个局域网都会瘫痪。从网络分布图可以看出,由于车载电脑CIC的光路出现了断路,所以导致整个局域网无法传输数据。
检查车载电脑CIC的电源,正常。断开车载电脑CIC的光缆插接器后重新插上,正常情况下插接器会持续发光近10s,表明光路已接通。但该车的插接器却完全不亮,说明总线驱动器没有工作。
故障排除:更换CIC,故障排除。
(杜强)
奔驰轿车换挡闯车
关键词:电路接触不良
故障现象:一辆2011年产奔驰C200轿车,搭载271型发动机和722.6型自动变速器,行驶里程3万km。用户反映该车有时换挡冲击严重。
检查分析:维修人员试车,发现该车换挡冲击现象实为偶发。当故障出现时,换入倒挡冲击非常明显,这说明故障与油压控制有关。检测变速器控制单元,未发现故障码。检测发动机控制单元时,发现其保存有与变速器控制单元通信中断的故障记录。对于控制器局域网而言,这类故障通常是由作为通信对象的控制单元电源中断引起。
查看变速器控制单元的电路图(图2),得知其电源是由前指令接收执行单元SAM提供的。打开SAM的上盖,可以看到具体的执行元件是一个继电器。拔下继电器测量各端子之间的电阻,正常。
不插继电器,将SAM上对应继电器输入、输出端的插座跨接。试车发现故障不再出现,说明故障点就在继电器内部。于是拆开继电器外壳检查,发现其电磁线圈的引线端从接点处翘起(图3),这导致了电路接触不良。
故障排除:更换继电器,故障排除。
(致远)
奔驰旅行车连杆断裂
关键词:连杆弯曲
故障现象:一辆2006年产奔驰R500旅行车,搭载273型V8发动机和722.9型自动变速器,行驶里程14万km。该车行驶中发动机缸体突然被连杆洞穿。
检查分析:维修人员为查明导致这起严重故障的原因,将损坏的发动机解体检查。发现由于1缸连杆断裂,导致缸体破损(图4)。据用户反映,故障发生前没有任何预兆。那么究竟是什么原因造成了如此严重的后果呢?
仔细观察气缸壁发现,1缸第一道活塞环留下的活塞上止点印痕有下沉的迹象(图5)。根据新印痕的色泽判断。活塞出现下沉已经很久。这表明在故障出现前,1缸连杆早已出现了弯曲。
这就解释了故障发生得如此突然的原因。原来连杆出现弯曲后,在弯曲部位便出现了横向剪切力。随着发动机运转时间的增加,连杆受伤部位的疲劳度也在不断积累。当某一瞬间连杆弯曲部位所受到的剪切力大于其承受强度时,连杆便发生了断裂。从连杆断裂处金属表面的颜色(图6)也可看出,的确是弯曲在前断裂在后。
那么又是什么原因导致连杆弯曲呢?检查发现1缸的进排气门都被顶弯了,但从活塞顶部的印记看(图7),这应是连杆断裂后,活塞运动与气门不同步所造成的。既然气缸内无任何异物,推测连杆的弯曲是在用户不知情的情况下由于气缸进水造成的。
故障排除:更换缸体和活塞总成,故障排除。
(王述杰)
高尔夫旅行车行驶异常
关键词:氧传感器信号偏差
故障现象:一辆2012年产进口高尔夫旅行车,行驶里程2万km。用户反映该车最高时速超不過60km/h。
检查分析:维修人员试车,发现该车怠速运转平稳,但行驶中加速明显无力。检测发动机控制单元,发现有氧传感器的故障提示(图8)。根据经验,若是氧传感器失效的话,一般不会对车辆行驶产生如此严重的影响。但此时除了此故障提示外,别无其他提示。
为了明确氧传感器信号与车辆行驶异常之间的关系,还是决定先查看与氧传感器有关的数据。读取发动机控制单元第32组数据(图9)时发现,氧传感器在怠速时工作基本正常,但在部分负荷状态下其信号偏高的自适应值却达到了极限。根据车辆的行驶状况看,氧传感器的实际信号应该是超出了其自适应的范围。这样在部分负荷条件下,由于氧传感器的信号偏差,使喷油量不断增加,导致混合气燃烧不良,发动机输出扭矩下降。
关键词:故障树;网络故障;系统研制
中图分类号:TP393.08 文献标识码:A文章编号:1007-9599 (2011) 12-0000-01
Network Failure Analysis System Development Based On Fault Tree Theory
Guo Yiwei1,Li Jinsong1,Huang Hongyong2,Xiao Jian2,Du Wenzheng1
(1.Xihua University,School of Mechanical Engineering and Automation,Chengdu610039,China;2.PLA 92762 Troops,Xiamen361000,China)
Abstract:In this paper the fault tree analysis techniques applied to fault diagnosis in computer networks,network management to improve the reliability,stability,flexibility,speed and accuracy of fault diagnosis,rapid network fault diagnosis,prediction and maintenance,to ensure high network service quality and reliability.
Keywords:Fault tree;Network failure;System development
一、引言
随着计算机网络的爆炸式的增长。网络无处不在,广泛的深入到人们的生活,网络基础设施的完善极大的促进了现代社会的发展。人们对网络的可靠性也提出了更高的要求:能够及时快速的进行网络故障分析,对保持网络的健康状态具有重要的意义。然而随着网络规模的日益膨胀,网络故障分析遇到了极大的困难,其主要表现在以下几个方面:
1.现代信息技术的广泛应用,计算机网络规模、网络复杂性和多样性都有了巨大的发展。大规模网络的故障关系错综复杂,网络故障分析难度越来越大。
2.新的网络设备产品不断推出,功能越来越多,结构越来越复杂、产品规格和标准不完全统一提高了故障诊断的难度。
3.国际互联网深入到人们的生活之中,网络信息量急剧膨胀,对网络故障分析提出了越来越高的要求。
二、计算机网络的层次化体系
为了在所有类型的计算机系统之间建立允许通信的网络系统,人们就推出了OSI参考模型。其含义就是推荐所有公司使用规范来控制网络。这样所有公司都有相同的规范,就能相互联接。提供各种网络服务功能的计算机网络系统是非常复杂的。根据分而治之的原则,ISO将整个通信功能划分为七个层次:应用层、表示层、会话层、传输层、网络层、数据链路层、物理层。
三、计算机网络数据的传输
OSI七层模型的每一层都对数据进行封装(网络节点将要传送的数据用特定的协议头打包来传输数据),以保证数据能够正确无误的到达目的地,被终端主机理解及处理。
四、网络故障故障树的建造
网络故障模式多种多样,发生故障的原因复杂,一个简单的故障模式就可能对应两条甚至多条原因,不同的故障模式下的原因也有可能部分相同;一个故障模式的发生还可能会导致其它故障模式的发生,关系的交织和相互影响,就使分析十分困难。在建造故障树过程中我们基于OSI参考模型来建造故障树网络故障主树如图所示;物理层故障主树、数据链路层故障主树、网络层故障主树、传输层故障主树、应用层(应用层、表示层、会话层)故障主树。
实际当中我们要了解的是设备发生了哪种故障,是从在线监测的数据和故障征兆来判断的。所以在了解故障树和故障模式分析所形成的关于网络故障机理和故障诊断实践的经验知识基础上,我们就要来研究分析来判断故障模式,形成分析报告。实际分析过程中,系统会依据规则知识,结合网络的结构、运行、维护等具体情况,对网络设备进行故障判断。
故障分析系统可以使计算机软件系统能够运用知识和事实以及推理机制去解决通常需要人类专家才能解决的复杂的问题。故障分析就是这样一个整体判断的完整的复杂系统。
五、分析系统的结构
故障分析系统工作原理如图所示。故障分析系统以用户提供的事实为基础,根据系统的故障树知识库,利用一定的推理方法进行推理判断,最后输出结果。从结构上讲主要是由故障树知识库和推理机所组成。
故障分析系统的功能是根据一定的推理策略从知识库中选择有关知识,对有关的证据进行推理,直到得出相应的结论为止。网络设备故障分析系统推理策略主要包含正向推理和反向推理两种方法:
基于数据的正向推理是:从己知的关于被诊断设备事实(主要指异常现象和试验数据)出发,不断匹配规则前提,直到得出关于故障模式的所有结论。
基于目标的反向推理:从故障模式的假设出发,不断地反向应用诊断知识进行规则前提的假设验证,当假设没有可用的规则时,推理机主动向用户询问。
反向推理目的性强,要求用户参与,但由于推理进程中假设多,因而推理搜索过程长且比较盲目。
参考文献:
[1]比奇洛,孙远运等.计算机网络故障排除与维护实用大全[M].北京:中国铁道出版社,2006
【关键词】网络故障 物理故障逻辑故障 维修方法
【中图分类号】TP393.01 【文献标识码】A 【文章编号】1672-5158(2013)04-0169-01
研究背景
计算机网络是由计算机各种软硬件和通信相关设备组成的系统,即利用各种通信手段,把空间上分散的计算机连在一起,达到相互通信而且共享软件、硬件和数据等资源的系统。随着计算机网络的发展,人们的生活得到了巨大的便利,但计算机网络的连接多样性、终端分布不均匀性和网络的开放性、互连性等特征,网络故障也越来越多,目前在各单位的网络中都存储着大量的信息资料,几乎所有是工作也依赖于网络,一旦网络被破坏造成信息的丢失将带来巨大损失。加强因此怎样解决网络故障是我们要面对和解决的重要问题,本文就是通过计算机网络故障进行分析并提出相应的对策,最后达到更好的运用计算机网络的目的。
常见网络故障
连通故障
连通故障又可以称为物理故障一般,即物理层中物理设备相互连接失败或者硬件及线路本身的问题:一是线路的连接故障,由于网线在使用过程中的损坏老化,或者接口处的松动等造成的网络连接故障。二是由于接口配置问题的物理故障,即由于接口的松动或者其他因素的损坏,使网线无法正常接入以及此类相关设备损坏导致故障。三是网卡的物理故障,主要是指由于网卡松动,使网络连接失效。
逻辑故障的种类
计算机网络的逻辑故障又称软件故障,主要是指软件安装或网络设备配置错误所引起的网络异常,其中最常见的是网络设备配置错误。逻辑故障与连接故障相比复杂得多。常见的网络逻辑故障有:主机逻辑故障、进程或端口故障、路由器逻辑故障等。主机逻辑故障通常包括网卡驱动程序、网络通信协议安装错误、网络地址参数配置不正确等。进程或端口故障是指进程或端口由于受到病毒或系统的影响而无法启动。路由器逻辑故障是指因为端口的配置错误而导致的网络故障,如路由器CPU利用率高和路由器内存余量太小以及SNMP进程意外关闭而造成的故障。另外网络地址的安全问题,也是计算机网络故障之一。网络用的TCP/IP协议本身就是一种安全风险,大量重要程序都以TCP为传输层协议,因此TCP的安全性问题会给网络带来严重的后果。四是网络结构的安全问题。互联网由无数个局域网组成,通常情况下计算机之间互相传送的数据流要经过重重转发,因此,攻击者只要接入任一节点就可以捕获所有数据包从而窃取关键信息。
计算机网络安全的相关技术
虽然计算机网络面临着诸多的安全问题,但是目前已有比较成熟的网络安全技术,包括防病毒软件、防火墙、入侵检测、安全扫描等多个安全组件组成,主要有防火墙技术、数据加密技术、入侵检测技术、防病毒技术等。
防火墙技术:
“防火墙”既可以阻止外界对内部网络资源的非法访问同时也可以防止系统内部对外部系统的不安全访问,其主要技术包括:数据包过滤、应用级网关、服务和地址转换。
数据加密技术:
加密的目的是保护网络节点之间的链路信息安全,可以进行数据加密、身份鉴别、访问控制、数字签名、数据完整性验证、版权保护等,用户可根据网络情况选择对称密钥密码体制和非对称密钥密码技术等不同的加密方式。信息加密过程操作简单,但是意义重大,在多数情况下,信息加密是保证信息机密性的唯一方法。
入侵检测技术:
分别基于网络和基于主机。由于网络的入侵检测系统主要采用被动方法收集网络上的数据。目前,在实际环境中应用较多的是基于主机的入侵检测系统,它可以不受网络协议、速率和加密的影响直接针对主机和内部的信息系统同时还具有检查木马等功能。
防病毒技术:
网络防病毒软件则主要注重网络防病毒。尝试利用360安全卫士等具有杀毒和软件修复功能的浏览器或Firefox浏览器,可以清除病毒,防止病毒软件对计算机网络系统的破坏。
安全对策以及维护方法
对计算机网络的维护包括对硬件的维护和对软件的维护。对硬件的维护包括检测联网电脑网卡、网线、集线器、交换机、路由器等故障、计算机硬盘、内存、显示器的维护。首先要仔细检查计算机网卡是否运行正常,检查网线以及网卡指示灯,如果出现故障,应及时更换网线,集成器等部件。检查网络插口股,在网络连接过程中,会因为物品挤压以及不小心造成的损坏,以及接口处的松动,而导致计算机无法联网,此时应对计算机与插口间的电缆线进行检查。利用测线仪等工具测试网线、接口、网卡以及交换机端口是否正常。对由于路由器配置错误会导致的故障,方法就是重新配置路由器端口的静态路。如果是由,只有对路由器进行升级、扩大内存。
对计算机软件的维护包括计算机网络设置的维护,对网络安全l生的检测,以及对网络通畅性的检测。多为浏览器本身故障或被恶意软件篡改破坏,导致无法浏览网页,对网络设置的维护。首先,检查Ping线路近端的端口是否处于关闭的状态,若是因为端口处于关闭状态,只需重新启动该端口即可。检查lP地址,TCP/IP选项参数是否正确,当所填参数有误时,可以通过lP地址,TCP/IP选项参数进行修改核对。对网络安全性的维护包括安装杀毒软件,经常性的进行查杀毒处理,安装的防火墙,设置高密的防治网络安全入侵的加密处理,定期的对网络加密设置进行更新。例如及时查杀病毒并,避免使用非正规的磁盘,不要打开垃圾邮件,不要随意点击非法网站。
【论文摘要】:随着网络技术的发展,网络故障也表现为多样化,网络故障的查找与排除也相对复杂。结合工作经验的实例,分析了气象业务中网络故障的不同种类,并提出了切实有效的诊断及排除方法。
随着越来越多的先进技术和服务引入到气象业务网络中,网络管理和维护工作变得越来越复杂。局域网在气象系统广泛应用中,常遇到各种故障,正式运行的网络一旦出了问题,需要及时进行检测和诊断,尽快定位并排除故障。
下面介绍一下网络故障的诊断和排除方法。
一、主要的故障种类
根据网络故障的性质把网络故障分为物理故障与逻辑故障,也可根据网络故障的对象把网络故障分为路由故障和主机故障。
1.1物理故障
物理故障即硬件连接故障,指的是设备或线路损坏、插头松动、线路受到严重电磁干扰等情况。网卡没有连接到主板上,网卡的电源灯和数据灯都不亮,设备管理器中检测不到网卡。网线没有连接好,网卡已经驱动,协议也添加,但仍然不能上网,观察网卡硬件连接,网卡只有一个灯亮,不闪烁。
如两个路由器Router直接连接,这时应该让一台路由器的出口连接另一台路由器的入口,而这台路由器的入口连接另一路由器的出口才行。当然,集线器C6D、交换机、多路复用器也必须连接正确,否则也会导致网络中断。还有一些网络连接故障比较隐蔽,要诊断它只有靠经验。
1.2逻辑故障
逻辑故障中最常见的情况就是配置错误,指因为网络设备的配置原因而导致的网络异常或故障。配置错误可能是路由器端口参数设定有误,或路由器路由配置错误以至于路由循环或找不到远端地址,或者是路由掩码设置错误等。逻辑故障的另一类就是一些重要进程或端口关闭及系统的负载过高。如线路中断,没有流量,用ping发现线路端口不通,检查发现该端口处于down的状态,说明该端口已经关闭,导致故障。
1.3路由器故障
线路故障中很多情况都涉及到路由器,也可以把一些线路故障归结为路由器故障。检测这种故障,需要利用MIB变量浏览器,用它收集路由器的路由表、端口流量数据、计费数据、路由器CPU的温度、负载以及路由器的内存余量等数据,通常情况下网络管理系统有专门的管理进程,不断地检测路由器的关键数据,并及时给出报警。
1.4主机故障
主机故障常见的现象就是主机的配置不当。如主机配置的IP地址与其它主机冲突,或IP地址根本就不在子网范围内,由此导致主机无法连通。主机的另一故障就是安全故障。主机没有控制其上的finger、RPC、rlogin等多余服务。而攻击者可以通过这些多余进程的正常服务或bug攻击该主机,甚至得到Administractor的权限等。
二、故障的检测和诊断
大多计算机用Windows操作系统,Windows提供了一些命令行检测工具,这些工具是网络诊断中常用的,而且一般的问题大都可以通过这些命令诊断出来。如果对这些命令很熟悉,在网络出故障时就会运用自如。
2.1用连接故障诊断工具Ping网络诊断
输入命令:ping172.18.82.201(172.18.82.201为本机地址),显示:Pinging172.18.82.201with32bytesofdata:Replyfrom172.18.82.201:bytes=32time=10msTTL=128有"time="的内容,表明可以ping通,网络协议TCP/IP协议正常。执行ping命令后得到信息:Pinging172.18.82.201with32bytesofdata:Requesttimedout.表示不可以ping通,或者是tcp/ip协议可能有问题,或者是计算机到交换机间的硬件连接存在问题。
测试数据传输丢包,输入Pingstatisticsfor172.18.72.56,显示:Packets:Sent=4,Received=2,Lost=2(50%loss),Approximateroundtriptimesinmilli-seconds:Minimum=177ms,Maximum=182ms,Average=89ms信息表示发送了4个数据包,回送收到2个,丢失2个,丢失率为50%。发送数据包最快回送时间177ms,最慢回送时间182ms,平均89ms。如可以ping通自己,也可以ping通邻居或能看到其他机器,表明本地设置正确。网关可以通过软件实现协议转换操作,能起到与硬件类似的作用。ping网关地址,例如ping172.18.82.17-t,就可以查看与网关是否连通。
2.2pathping命令
pathping用于跟踪数据包到达目标所采取的路由,并显示路径中每个路由器的数据包损失信息,也可以用于解决服务质量连通性问题。是一个比tracert更为有用的工具。它将ping和tracert命令的功能和这2个工具所不提供的其他信息结合起来。由于该命令显示数据包在任何给定路由器或链路上丢失的程度,因此可以很容易地确定可能导致网络问题的路由或链路。不过WIN9X/Me、WindowsNT不提供此命令。命令格式是:pathpingtargetname,比如c:\>pathping172·19·3·1,
Computingstatisticsfor75seconds···
SourcetoHereThisNode/Link
HopRTTLost/Sent=PctLost/Sent=PctAddress
0jishu-sun[172·19·1·242]0/100=0%|
10ms0/100=0%0/100=0%172·19·1·20/100=0%|
25ms1/100=0%1/100=0%172·19·6·20/100=0%|
34ms0/100=0%0/100=0%172·19·3·1
Tracecomplete·
可以看出,它先提供给我们查看路由的结果,然后等待75s(此时间根据跃点数变化)最后显示测试结果。第3列是源到当前的丢包数。第4列是指明线路和路由器丢包情况,最右边的栏中标记为"|",表明沿线路转发丢失的数据包,该丢失表明链阻塞;最右边栏中为IP地址的,表明该路由器的丢失率,可能是由于路由器CPU超负荷所致。如果某一处丢包严重,则应采取必要的措失,以提高通信质量。
三、故障排除的解决方案
不系统的故障诊断与排除方法将导致在网络故障现象相互依赖和偶然性的迷宫中浪费时间。系统的网络故障排除方法的总体思路是系统地将产生故障可能的原因所构成的1个大集合缩减成1个小的子集或者直接确定故障起因。
3.1网络适配卡中断与其他硬件资源冲突
在"系统"的"设备管理器"查找旁边出现感叹号的有黄圈的网络适配器项目,找到项目网络适配器可能与其它设备使用同样的资源设置。双击网络适配器项目,在网络适配器"资源"中更改网络适配器的中断和I/O地址,避免与其它硬件冲突。用即插即用的网络适配卡,可使用制造商提供的安装盘将即插即用型改为跳线型,设置网络适配卡的中断和I/O地址。
3.2在"网上邻居"中没有显示网络中的其它计算机
打开"网上邻居"时,将显示你的计算机,如果计算机所在的工作组设置不正确,打开"网上邻居"时看不到所需的计算机。在"网络"的"标识"更改工作组的设置。
确认计算机是否安装了必要的网络组件,如果没有安装正确的网络客户、适配器和协议组件,将不能与网络通信。在"网络"的"配置"中可看已安装的网络组件。确认所安装的网络客户软件和协议是否适合所连接的网络。局域网中尽量采用TCP/IP和NETBEUI协议,或者只用NETBEUI协议。
参考文献
计算机网络技术的普及和发展,给人们的生存方式带来了巨大的变革。人们通过计算机网络获取资源、交换信息已经成为一种常态,但在网络的使用过程中难免会存在各种问题,对人们的学习、工作和生活造成不便,甚至影响到关键数据和经济财产的安全。因此,了解计算机网络的常见故障和处理方法尤为重要。
1 计算机网络的故障类型
计算机网络故障一般可分为物理故障和逻辑故障两类。
物理故障是指由于硬件原因引起的网络故障,常常表现为本地连接断开、网络时断时续等。常见的物理故障包括网线损坏、路由器和交换机故障、网卡损坏、元件接触不良等。
逻辑故障通常表现为本地连接受限、网络不稳定、浏览器显示异常等。逻辑故障主要由计算机网络参数错误、网卡驱动不兼容、路由器配置不合理和病毒入侵等原因造成。
2 计算机网络故障的诊断方法
计算机网络故障具有多变性和复杂性,涉及网线、网卡、路由器、病毒等多方面原因,当计算机网络发生故障时,我们可以根据经验初步判断故障类型,逐层排查,最终确定故障所在。计算机网络故障的诊断应从三个方面入手。[1]
1)先检查可直接观察和判断情况的外部设备,如网线是否损坏、路由器指示灯是否正常等,再考虑设备内部的软硬件问题。
2)先检查是否为本地计算机的网络故障,如病毒入侵、驱动程序损坏、网卡松动等,再考虑网络链路、路由器、交换机的故障。
3)先检查计算机、路由器的网络参数配置,如果没有问题,再考虑设备的硬件故障。
3 常见故障的分析和处理方法
3.1 物理故障
1)线路连接问题
线路连接问题是硬件故障中最常见的一种,占所有网络故障的70%以上。[2]常见的线路故障包含接口松动、线路损坏和电磁干扰三类,例如路由器或交换机的电源插头未通电、RJ45水晶头损坏或松动、网线因挤压和拉扯而损坏、周边有较强电磁波干扰等。线路连接的检测可通过替换排除法和专业仪器测试的方式进行。对于水晶头和线路损坏等问题,可通过更换来解决;对于电磁干扰问题,则可选用屏蔽强度较高的网线。
2)路由器和交换机故障
路由器和交换机是计算机网络中路由转发和数据交换的核心设备,是局域网内设备能否连通广域网的关键。路由器和交换机故障主要是指物理损坏,造成设备不能通电、端口故障等问题,可通过信号灯的状态和替换排除法进行判断。
信号灯的状态直接反映了路由器和交换机的工作状态,如系统运行和端口连通是否正常。在使用替换排除法时,可将网线逐个连接到路由器和交换的端口进行检测,如果部分端口连通正常,则可判定为设备的端口故障;如果所有端口均不能连通,则可判定为零部件发生故障。如果路由器不能加电而电源线连通正常,则考虑是路由器的电源问题。
3)计算机网卡问题
计算机网卡发生故障,也将导致网络连接出现问题,常见的故障包括网卡松动、网卡金手指氧化、网卡硬件故障、卡槽损坏等。网卡的故障检测分为两个步骤进行:(拔出网卡,仔细清理卡槽内的灰尘,用橡皮擦小心擦拭网卡金手指,之后重新插入卡槽,如果恢复正常则认定为网卡松动和金手指氧化所引起的接触不良。(如步骤一无法恢复正常,可将正常使用的网卡更换到故障计算机中,如果问题得以解决则说明是网卡硬件故障,更换网卡即可,否则就可能是网卡的插槽损坏。
3.2 逻辑故障
1)路由器参数配置问题
路由器在购买和安装之后通常需要进行参数配置,包括网络参数、DHCP、安全管理等设置,如果参数配置错误,则会引起网络连接不上、经常掉线等问题。路由器的参数配置首先是WAN口的配置,需要根据具体的网络环境设置WAN口的连接类型和连接模式,例如静态IP还是PPPOE拨号、是自动连接还是定时连接等。
在一些大型的局域网环境中,难以做到给每一台计算机进行参数分配,为了避免IP地址冲突和提高使用运行效率,还需进行DHCP服务器的配置,如果参数配置出现问题,则会影响整个局域网的连接。此外,有些路由器还进行了安全管理设置,如访问限制、防火墙和远程web端口的设置等,都影响了用户的网络连接。
2)计算机网络配置问题
计算机的网络配置主要是指通信协议(TCP/IP)的配置,通信协议被破坏或遭到篡改都会导致网络连接故障。当计算机出现网络连接受限等提示时,应首先检查TCP/IP的设置是否正确,如是否设置了静态IP和DNS服务器的地址,以及IP地址是否和路由器在同一个网段等。如果网络连接正常,QQ能正常使用但不能访问浏览器网页时,则往往是DNS的配置出现错误,一般来说,重新设置DNS服务器的地址即可解决问题。
3)计算机网卡驱动程序问题
计算机网卡驱动程序的问题一般分为两种:驱动程序未安装或被卸载、驱动程序与网卡不兼容。使用者由于误操作而删除驱动程序和相关文件的事情时有发生,造成网络连接错误或找不到本地连接等问题,可打开设备管理器,查看网络适配器的运行状态,如果有黄色问号或运行不正常等提示,则卸载驱动程序重新进行安装。
网卡驱动程序不兼容的问题常常出现在重装电脑的过程中,造成驱动程序无法安装或网络连接故障等,可对驱动程序进行升级,或下载官方驱动程序重新安装,一般可解决问题。
4)网络病毒攻击和黑客入侵问题
网络病毒攻击和黑客入侵波及范围大、危害程度高,是最常见网络故障诱因之一,可造成计算机网络访问异常、整个局域网运行缓慢、核心设备参数被篡改、关键数据被盗取等种种问题,严重的可引起整个网络瘫痪、造成经济损失和威胁人身安全,是计算机网络安全防护的重中之重。一旦出现网络连接异常和安全信息提示时,应立即进行漏洞修复、病毒扫描等相关处理。此外,路由器、防火墙等核心网络设备的管理账号和口令应具备较高的复杂性,以提高网络安全防护性能。
4 计算机网络的维护
为了减少网络故障的发生、提高网络运行的效率和安全性,在使用过程中,我们还需对计算机网络进行合理的维护,主要包括以下几方面。
1)定期检查设备的运行情况
定期检查计算机、路由器、交换机等设备的运行情况,对出现故障的设备进行及时的维修和更换,避免因设备的突然损坏造成不必要的损失;同时应对软件系统进行维护和更新,及时修复系统漏洞、安装系统更新、升级安全防护软件,保证网络的稳定运
2)加强安全防护措施
加强路由器的安全性措施,限制系统的物理访问,禁用不必要的功能和端口,严格管理登录账号和口令,防止病毒攻击和黑客入侵;[3]还可设置一定的网络访问限制,规定哪些网站用户不可访问,避免用户因误操作而带来的安全隐患。
3)保持网络机房的环境卫生
计算机、路由器等设备在使用的过程中,CPU、主板、风扇、卡槽等部位容易积累大量的灰尘。灰尘会影响设备的散热性能,造成零部件的接触不良,加速设备的老化,而且容易引发静电,可能导致元件的损坏。因此,需定期对设备进行除尘,保持网络机房的环境卫生。
5 结束语
随着科学技术的发展,计算机网络已经成为人们生活的重要组成部分,了解计算机网络的常见故障和处理方法,重视计算机网络的日常维护,才能使我们做到在故障发生前积极防范、在故障发生后迅速补救,使网络的运行更稳定、更高效、更安全。
“邯郸学步”也好,“照猫画虎”也罢,总之,一遇到网络故障,就按照这些思路来办吧!
一位网管的牢骚
现在的网吧客人,开机不会,输入法切换不会,字母大小写转换不会,玩私服登录器怎么用不会,QQ开语音不会,进了游戏不会退出,私服服务器关了说我机子有问题。语音聊天不会开MIC,说网吧耳机是坏的,看电影嫌不是普通话的!QQ登录不上说机器不好,我跑过去一看,密码不对,他还问我密码多少!!
打个CS别人放颗烟雾弹,他遭闪了,狂喊:网管死机了……今天有客人还问我,网管我这里怎么没有QQ币呢,你帮我下载点QQ币……我%#%##,那玩意要是能下载,我TMD就不用上班了~
小提示:如何具体对某层进行排查?
网络故障在OSI模型的每一层,都有相应的检测排查工具或措施:物理层,使用专门的线缆测试仪;数据链路层,使用简ARP命令来检查MAC地址和IP地址之间的对应关系;网络层,除使用ping命令测试连通性和route命令查看路由配置外,还需要使用网络检测分析软件对网络层和传输层的数据通信进行检测分析;应用层,检测应用程序配置是否正确,对应用程序自身进行测试。
总原则:OSI模型与网络故障的排除
做网管的,相比对“OSI”这个概念或多或少都有了解吧。为了降低设计的复杂性,增强通用性和兼容性,所有的计算机网络都设计成层次结构,并且是统一的――这种层次结构就是OSI。
1.通过OSI模型来排查问题
那么,这个OSI模型与解决网络故障有什么关系呢?实际上,一个很简单的道理――既然任何网络都是由这7层构成的,那么网络发生故障,也就是7层中的某一层,或者某几层出了问题,所以解决故障,就是解决层的故障了。这么说可能大家有点晕乎乎,我们举个例子来讲一下吧。
实例1:某客户端不能访问web服务
我们一般解决这一故障的思路是:首先检查客户端Web浏览器是否正确配置,可尝试使用浏览器访问另一个Web服务器;如果Web浏览器没有问题,可在Web浏览器上测试Web服务器是否正常运行;如果Web服务器没有问题,再测试网络的连通性……
这个思路是什么意思呢?其实它就是从OSI模型的“应用层”出发,一直到“物理层”(网卡是否损坏?网线是不是断了?)。
网管在分析和排查网络故障时,应充分利用网络这种分层的特点,快速准确地定位并排除故障,这便是本文要介绍的总体思路。
2.两种逐层排查方式
对于这一思路,通常有两种逐层排查方式:一种是从低层开始排查,适用于物理网络不够成熟稳定的情况,如组建新的网络、重新调整网络线缆、增加新的网络设备等;另一种是从高层开始排查,适用于物理网络相对成熟稳定的情况,如硬件设备没有变动,而软件曾经变动,比如新装了TCP/IP协议、重装了操作系统和浏览器等等。
无论哪种方式,最终都能达到目标,只是解决问题的效率会不同而已。比如实例1中,如果你颠倒顺序,从“物理层”开始排查,那问题最终可以解决,但恐怕得花上一整天,结果却发现――原来是那个网站出了问题,别的一切正常……
小提示:什么是OSI模型?
OSI,即OpenSystemInterconnection,开放系统互联。最早的网络刚刚出现的时候,很多大型公司都拥有网络技术,公司内部计算机可以互相连接,但却不能和其他公司连接,因为没有一个统一规范。ISO正是为此而来,它把网络分为物理层、数据链路层网络、网络层、传输层、会话层、表示层、应用层等7层,其中每一层都有其作用(见图1)。
图1
3.不可过于教条
前面介绍的两种“逐层”排查方式显得比较古板,实际操作时,大家记得要灵活运用,否则可能浪费很多时间和精力。一种比较通用的方法是――折中法。
第1步 涉及网络通信的应用出现故障,直接从位于中间的网络层开始排查,首先测试网络连通性。具体就是使用ping命令。这也是几乎所有网络故障发生后,网管第一步要做的就是ping的原因。
第2步 如果网络不能连通,再从物理层(测试线路)开始排查。如果网络能够连通,再从应用层(测试应用程序本身)开始排查。
实例2:网络之间不能正常通信
方法1:首先我们要ping远程计算机,成功则说明系统和网络正常,失败后再ping同一子网的网关来确定是否能连接到路由器。失败后再ping 127.0.0.1来确认TCP/IP协议是否正常。
方法2:首先ping 127.0.0.1,如果成功则ping同一子网的网关,如果成功则ping其他网关,直到最后ping远程主机。
这两种排查方法的思路是不一样的,方法1是从高层到低层,而方法2是从低层到高层。至于具体如何灵活去安排排查的顺序,这个是不一定的,需要大家经验的积累,经验能告诉你究竟怎样效率最高。
习惯:网络故障排除的经验
前面我们从技术的角度来介绍一些排除故障的思路,下面就从人为经验方面做些介绍。实际上,一个好的习惯对故障解决是非常重要的,尤其是长期需要和“故障”打交道的网管。
第1步 你真的知道“故障”是怎么回事吗?
在开始排除故障前,准备好纸和笔,将故障现象记录下来。在识别故障的时候要注意以下几点:
当故障发生的时候,正在运行哪些程序?
这些程序以前是否成功运行过?
如果成功运行过,最后一次运行是在什么时候?
发生故障之前对系统、软件配置以及硬件设备配置做了哪些更改?
第2步 列举可能导致故障产生的所有原因
将所有可能导致这一结果的情况列出来,记得不要放过任何细节、任何可能。比如无法浏览网页时,到底是网卡故障、网络连接问题,还是网络协议设置不当,或者是IE浏览器的参数设置有误,或者干脆是ISP出了问题?
第3步 缩小包围圈
故障排除的时候有几个原则:
先操作简单的,后操作复杂的:比如ping就很简单,而要用测试仪查查网线是否断裂就是复杂的。
先来“软”的,后来“硬”的:对软件设置问题的解决往往具有回溯性,且容易操作,建议将这部分放在最开始。
从本机到本地,从本子网到大局域网,从局域网到互联网:范围由小到大,容易让问题不那么复杂。