致力于成为中国智能制造领域的领先者
客服热线 400 - 680 - 1988 EN
巨宸科技教您如何处理工业服务器的日志“海洋”

  日志有些是设备运行中主动输出的,有些则是运维的人员通过特定命令到设备上采集到的,通过对这些日志进行分析,从而对设备、系统以及业务的运行情况进行评估,一旦发现异常,技术人员就能立即采取处理。
 
  但是,在庞大的工业服务器机房内,海量的日志如不经过处理,直接输出到监控平台,那将会是十分“恐怖”的一件事情。那么,应当如何对工业服务器的海量的日志信息进行处理呢?下面,就由我们巨宸科技来简单的谈一谈我们的经验总结吧。
 
  一、做标准化处理
 
  数据中心要有各种日志的采集系统,将所有日志汇集起来,这些日志来自不同设备、不同系统、不同业务,格式和含义都不一样,数据中心要做标准化处理,转换成统一识别的格式,这个格式完全由数据中心定义,由技术人员进行转义,形成标准化的日志语言。


工业服务器
 
  二、做日志过滤
 
  日志经过标准化处理,整齐划一,格式统一,但数量仍没有减少,所以需要做过滤。过滤的原则是将级别低的、操作类的、提示类的日志过滤掉,将级别高的、异常类的日志留下来。具体到各种设备的日志,要由设备商提供全系列的日志信息,并标注优先级和表达的含义,由数据中心将这些信息输入到知识库中,作为过滤判断的条件,知识库是一个逐渐积累的过程,不仅是日志的过滤,还包括各种故障的处理方法、经典案例、解决方案等等,经过知识库的过滤,将大部分的无用日志排除掉。
 
  三、做压缩归并
 
  将过滤后的日志同类的要归一化,尤其是在知识库中已经存在过的,这类日志如何处理,在知识库中可以找到答案,这时可以直接按照知识库的指导来做。如果没有遇到过的日志,则要交给下一级继续处理,通过压缩归并也可以将日志的数量再次减少。


工业服务器机房
 
  四、做关联分析
 
  很多日志的来由都是有根源的,比如在一台运行中的网络设备上突然有一条OSPF链路震荡了,那么可以检查一下在同一时间,是否也有其它OSPF邻居也震荡了,如经过日志检查,在另外多台设备上也有OSPF震荡,并且都集中连接到一台设备,而这台设备再查日志原来有人正在做reset ospf主动运维的操作,当通过这系列的关联分析,就可以找到原因,及时将这种人为操作的原因告诉监控中心,并不会作为一种异常的故障告警出现。
 
  五、做定位分析
 
  将预期内产生的日志消除后,来到第五步,这时的日志往往需要深入分析,如果在现有的知识库里找不到解决方案,并且日志本身的告警级别还很高,这时就要输出告警了,经过这五步处理,能够输出告警的日志已经很少了。
 
过程控制服务器

  综上所述
 
  各位用户都了解到了如何进行工业服务器的日志处理了吧。相信大家都能定期处理和维护好我们服务器的日志“海洋”,让我们的服务器能够更好、更快的运转。