本文详细介绍如何从零搭建一个轻量级内网监控平台,涵盖工具选型、部署步骤、告警配置等核心环节,帮助中小企业或IT团队低成本实现网络设备、服务器及服务的实时监控。
一、内网监控平台的核心需求
搭建前需明确监控目标:
- 设备监控:服务器/路由器/交换机的CPU、内存、磁盘状态
- 服务监控:HTTP/MySQL等服务的存活检测
- 流量分析:内网带宽使用趋势
- 告警机制:异常实时通知
二、推荐工具组合方案
轻量级方案推荐:
基础监控组合
Prometheus(数据采集) + Grafana(可视化) + Alertmanager(告警)
替代方案
Zabbix(一体化方案)或 Netdata(实时仪表盘)
三、具体搭建步骤(以Prometheus为例)
1. 环境准备
准备一台Linux服务器(2核4G配置即可):
安装Docker(所有组件容器化运行)
curl -fsSL https://get.docker.com | sh
2. 部署Prometheus
创建配置文件目录
mkdir -p /opt/prometheus
配置prometheus.yml(示例监控本机)
cat > /opt/prometheus/prometheus.yml <<EOF
global:
scrape_interval: 15s
scrape_configs:
- job_name: 'node'
static_configs:
- targets: ['localhost:9100']
EOF
启动容器
docker run -d --name=prometheus
-p 9090:9090
-v /opt/prometheus:/etc/prometheus
prom/prometheus
3. 添加Node Exporter
在被监控机器上部署数据采集器:
docker run -d --name=node_exporter
-p 9100:9100
-v "/proc:/host/proc"
-v "/sys:/host/sys"
prom/node-exporter
4. 部署Grafana可视化
docker run -d --name=grafana
-p 3000:3000
grafana/grafana
登录http://服务器IP:3000,默认账号admin/admin,添加Prometheus数据源后导入Node Exporter仪表盘模板
四、进阶配置建议
- 告警规则:在prometheus.yml中配置CPU>90%等阈值规则
- 企业微信/钉钉通知:通过Alertmanager集成
- 日志监控:增加Loki+Promtail组件
五、常见问题排查
问题现象 | 解决方案 |
---|---|
Prometheus无法采集数据 | 检查targets状态(http://IP:9090/targets) |
Grafana图表无数据 | 验证数据源连接状态 |
告警未触发 | 检查Alertmanager路由配置 |
通过以上步骤,可在1小时内完成基础监控平台搭建。对于50台设备以下的内网环境,该方案资源占用率通常低于10%。
评论