-
看完这篇文章,你就明白运维监控体系了
总结归纳运维工作中的监控内容。 监控目标 明白监控的重要性以及使用监控要实现的业务目标 通常包括以下三点: 对目标系统进行实时监控 监控可以实时反馈目标系统的当前状态 目标系统硬件、软件、业务是否正常、目前处于何种状态 保证目标系统可靠性,业务可以持续稳定运行 有问题第一时间反馈出来,便于运维人员处理 监控方法 了解监控对象 例如:CPU如何工作? 性能基准指标 例如: CPU使用率、负载、用户态、内核态、上下文切换 报警阈值定义 例如: CPU负载高的定义,内核态、用户态多少算高 故障处理流程…
-
基于 Go 语言开发的监控系统
01 介绍 小米开源的监控系统 open-falcon 和滴滴开源的日志采集工具 falcon-log-agent 作为一组黄金搭档,被互联网公司广泛使用。 本文介绍怎么使用这组黄金搭档监控业务系统的日志。 02 open-falcon open-falcon 使用 Golang 和 Python 开发,其中 Python 主要开发的是 Dashboard。 限于篇幅,本文不准备介绍 open-falcon 的原理,仅介绍如何安装。 安装 open-falcon 之前,必须确保已成功安装 Re…
-
从零搭建一个基于 ELK 的日志、指标收集与监控系统
在需要私有化部署的系统中,大部分系统仅提供系统本身的业务功能,例如用户管理、财务管理、客户管理等。但是系统本身仍然需要进行日志的采集、应用指标的收集,例如请求速率、主机磁盘、内存使用量的收集等。同时方便的分布式系统日志的查看、指标的监控和告警也是系统稳定运行的一个重要保证。 为了使得私有化部署的系统能更健壮,同时不增加额外的部署运维工作量,本文提出了一种基于 ELK 的开箱即用的日志和指标收集方案。 背景 在当前的项目中,我们已经使用了 Elasticsearch 作为业务的数据储存,同时利用 …
-
5天吃透王牌监控Zabbix,进阶年薪30W!
我们先看两张薪资对比图: 再来看看月薪2W运维的JD: 同样都是运维工程师,都是在上海,为何薪资待遇有如此大的差距?月薪6K的运维和月薪2W的运维到底是差在了哪儿? 让我们先来简单总结一下不同阶段运维工程师需要掌握哪些技能? 初级:Linux基础、系统管理、网络基础、Shell脚本编程基础 中级:数据库、安全、监控系统、Shell脚本编程进阶、Python开发基础 高级:集群、虚拟化、监控系统、自动化、python开发进阶、性能优化 由此可见,监控是运维工程师职场上的“分水岭”。 监控为什么会成…