本文目录
服务器用什么监控软件好
曾经做过几次大规模服务器监控,下面推荐几款监控软件和辅助软件。
1. zabbix 一款老牌经典的监控软件。 是一个企业级的分布式开源监控方案。能够实时监控从成千上万台服务器、虚拟机和网络设备中收集到的数以百万计的指标。
提供图形操作界面,可以方便的添加监控指标、告警指标。支持邮件、微信等的告警通知。
2. Prometheus,近些年监控方面的当红炸子鸡?,Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB)。Prometheus使用Go语言开发,是Google BorgMon监控系统的开源版本。
其优点是轻量级,配置简易,上手简单,丰富的告警模板。
以上是两款监控软件,下面推荐几款监控辅助软件。
1. grafana监控展示界面,在我们获取到监控数据后,可能需要把数据展示出来,给领导们邀功。grafana就是这样一款软件,开源免费,模板丰富。可直接对接 zabbix prometheus 和 mysql数据库等。
2. 钉钉机器人。服务器出现告警怎么办,当然是发消息通知运维人员啊。 钉钉机器人就提供这么一个功能。在钉钉群里面直接创建机器人,会给我们一个restfull的接口,我们就可以直接发送post请求。 原生linux就直接用curl发送, Prometheus提供插件可以直接对接。
本人做php开发,想转linux运维,不知道linux运维工程师前景咋样
公司某天说我们的业务要用PHP,Java.net开发,运维就得马上学习这三门语言的相关知识,你不懂怎么运维?结果被几年经验的的Java工程师虐了;
公司说我们的数据库要用SQLserver,MySQL,Oracle作为数据库,运维就得马上学习这些数据库的一些知识,你不懂怎么运维?结果被DBA大哥虐了;
公司今年用Cisco设备,明年用Juniper,你就得马上学,不懂怎么运维?后来你又央求只懂网络的厂商工程师做个培训;
公司说我们打算用ganglia,zabbix,cacti作为监控,你就得趴上去马上学,不学怎么做运维?
你学了三四年,什么都摸摸认为自己很牛了,知识面全嘛,仔细一想都快涵盖信息领域的各个面了~,欣喜跳槽发现公司都在用Python,redis,storm,spark激不激动?怎么办?学呀,不学怎么运维?
你又费了九牛二虎之力啃了个外熟里生;
后来HR招聘
网络精通么?不精;数据库开发精通么?不精;业务开发精通么?安全精么?不精;不精;那你精通什么?我什么都会……
HR说“不精没关系,但我们要有Java项目开发经验的人做运维”,惊不惊喜?
可你看四年前旁边搞PHP的小哥发展路线
第一年PHP+MySQL+搞项目;
第二年PHP+MySQL+搞项目;
第三年PHP+MySQL+搞项目;
第四年跳槽,面试的是web PHP开发,
但已经是资深了,做了项目经理;
术业有专攻,给你10000小时,开发可以在1个产品技术领域深耕,而运维要在8个产品领域内学习,精力太分散,很难让你静下心来研究某个领域,因为这是你的工作性质;
当然,各个行业都有大牛,有些人就是可以在有限时间内做很多别人做不到的事,天分和努力可以超越常人很多层次,这些不在讨论对比的范围内,大多数人还是专一一点更能取得更多的回报;
另外,还有一点,十人内的项目基本不需要运维,但十人内的项目开发占了大部分~
运维重要么,重要!那为什么好多小公司不要运维,工作都被开发分担了呀;那为什么大公司运维待遇那么好,天分和努力呀~
nagios和cacti的区别
nagios和cacti都是IT信息系统监控利于的优秀老牌软件。
监控一般分为报警和指标监控分析。nagios重报警,一旦设置的阈值满足报警条件就告警,而且有前端页面可以非常清晰的展现;cacti重指标监控与画图,可以对历史数据进行分析,比如知道一天、三天、一个月的网络出口流量,而nagios比较欠缺,但cacti的告警不是很灵活。
一般在工作中,已经废弃掉了cacti,取而代之的zabbix或者小米的openfalcon,而nagios我们一直坚持使用,就是因为nagios的告警真的很好用。
zabbix和cacti哪个好用
一般这类工具,会用的就好用,不过我个人比较喜欢zbx,毕竟用了好多年了。也比较顺手,至于国内比较流行的三款监控软件的关注度,我觉得zabbix比其他两个强不少,但是不代表其他两款软件不好,还是那个你用的熟,用那个。
怎么才能实现随时随地监测服务器运行情况
针对每一个问答都本着绝不大胆胡说,只管小心求证的态度,疯评科技来解答您的提问。
想要随时随地监测服务器的运行情况,需要使用专业的监控软件。下面具体来说一说。
监控软件的功能要求
首先理清楚自己的需求,需要监控什么指标,监控方式,能否预警,历史数据是否保存,是否需要图形,只有对这些进行了充分了解,才能进行目标选定。
常用监控指标如下:
设备的运行状态有cpu使用情况,内存使用情况,硬盘使用情况,设备温度,运行时间等。
网络运行状态有流量,网卡状态,端口状态,路由条目数,路由协议状态等。
其它有ups运行状态,电量,光纤功率,电源状态等。
监控方式有 snmp,,wmi,agent等。
预警需求有短信,电话,邮件,微信等。
相信经过这一系列的了解,对监控软件就走了选型了,这里我自己管理的网络用的流量监控软件是cacti和zabbix,其它状态监控用的是PRTG,还有设备厂商自带的监控软件。
监控软件的安装部署
在选定了监控软件后就是进行安装部署了,选用本地服务器还是云服务器都是可以的,需要服务器保持稳定,能够存储一定量的监控数据。
有的监控软件安装比较简单,比如Windows环境下的,涉及到数据库安装的就复杂一些,相比较而言,Linux下的监控软件性能更好,更稳定,当然非专业人员部署起来也比较困难。
监控软件安装完成后,需要进行必要的配置,包括监控目标的添加,参数调整,阈值设置,预警方式等。
在设置完整后,需要对所有配置保存并备份,并做定期备份计划,以确保数据安全。
随时随监测服务器
经过前面的准备,我们已经可以实现随时随地监测服务器了。具体实施可以如下来做:
有web登录功能的监控软件直接在手机浏览器中访问,并存入收藏夹,以被随时登录查看服务器状态。
有app客户端的监控软件则直接在手机上安装app进行查看。
没有web和app登录方式的则手机需要有远程软件,进行远程登录查看。
通过上述所说,用手机即可以轻松实现随时随地监测服务器的情况,当然有条件的,可以对监控软件进行二次开发或者自己开发所需功能的监控软件。