<返回更多

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

2021-07-13    IT狂人日志
加入收藏

做运维的都知道,服务器出点问题,就够我们受的,轻则被骂,重则丢饭碗,所以,每逢节假日,我们恨不得在机房点上三柱香、贴上几张符,给服务器和网络设备跪拜一番,求它们别出问题,也让我们过个清闲的假日。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

 

然而,服务器虽然有一两颗火热的心,但是他们出起问题来,却都是冰冷冷的,一点都不讲情面,总是留下我们在机房凌乱而慌张。

所以,给服务器配置邮件告警,让它有小问题的时候,及时主动地通知我们,是为上策,我们也好及时处理,防患于未然,免得出大问题的时候,手忙脚乱。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

 

本文以戴尔R740服务器为例,讲解邮件告警的配置过程,需要说明的是,戴尔服务器的iDRAC功能非常强大,硬件监测、系统安装和维修都不在话下,邮件告警只是其中一个功能而已。

直奔主题,打开“SMTP(电子邮件)服务器设置”,见图1,在不久以前,这些选项填写正确后,就能发送测试邮件了,但是现在基本上不行了,笔者测试了好多个品牌的邮箱,都发送失败了。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

 

正确的步骤如下:

1、到戴尔官网下载最新的iDRAC固件程序

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

 

2、服务器做了虚拟化,里面有一台虚拟服务器安装了windows Server 2016,遗憾的是,在虚拟机里面升级iDRAC固件程序失败了。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

 

3、在iDRAC界面里面找到手动更新,上传刚才下载的固件程序,完成后直接安装即可,放心,服务器是不会自动重启的,也不必重启,安装完成后,会有短暂的几分钟无法登录iDRAC,那是固件在更新而已,不用担心。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

 


服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

 

注意版本号,iDRAC固件已经升级到最新的5.0了。

  1. 现在可以配置SMTP服务器了,笔者使用的是腾讯企业邮箱,具体设置见下图,注意SMTP端口号465,和连接加密协议是配套的,需要根据邮件供应商的参数设置。
服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

 

  1. 设置完成后,一定要进行测试,确认能收到测试邮件,才表示邮件告警成功完成了第一步的配置。
服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

 

6、如果测试邮件发送失败,那么请检查是否为iDRAC配置了DNS服务器,没有配置正确的DNS服务器,邮件是无法发送的。见下图。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

 

7、有时候,你会发现,测试邮件是收到了,可是时间不对啊,那是因为没有配置正确时区和NTP服务器,不好意思,经与戴尔公司沟通,iDRAC界面并不支持直接设置时间,所以要想让邮件显示正确的时间,只能配置NTP服务器,笔者选择了阿里的NTP服务器,以保证时间的正确性。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

 


服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

 

  1. 收到测试邮件,并且时间正确后,就可以配置警报了,先启用警报,然后配置警报的类别和问题的严重性,笔者简单粗暴地选择了“快速警报配置”,类别选择了“系统运行情况”、“存储”和“配置”,问题严重性选择了“严重”和“警告”。
服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

 

其实服务器硬件并不值钱,坏什么换什么就是了,数据是最重要的,所以一旦收到“存储”的警报邮件,哪怕只是个“警告”,也一定要严阵以待、谨慎处理,该换硬盘的时候,千万别心疼那几个硬盘钱,要是数据文件丢失了,那饭碗也就基本上丢了,各位且行且珍惜吧。

——笔者为网络工程师,擅长计算机网络领域,创业多年,希望把自己的经验分享给大家,觉得有用的,可以关注、点赞、转发,如有相同或者不同观点,欢迎评论。

声明:本站部分内容来自互联网,如有版权侵犯或其他问题请与我们联系,我们将立即删除或处理。
▍相关推荐
更多资讯 >>>