匠心精神 - 良心品质腾讯认可的专业机构-IT人的高薪实战学院

咨询电话:4000806560

用Python实现Linux系统监控和报警

一、前言

Linux系统管理中,常常需要实时监控系统运行状态,及时发现并处理异常情况,以保证系统的可靠性和稳定性。本文将介绍如何用Python实现Linux系统监控和报警功能,帮助管理员及时发现系统问题,避免系统崩溃和数据丢失。

二、系统监控

1、CPU监控

CPU是计算机的核心组件之一,其行为是Linux系统最重要的监控指标之一。使用Python脚本可以实时获取CPU的占用情况,并将结果输出到本地文件或远程服务器。

2、内存监控

内存是Linux系统中最重要的组成部分之一,它存储了系统运行所需的数据。使用Python脚本,可以实时获取系统的内存使用情况,当内存使用率超过设定的阈值时,Python程序将触发报警操作。

3、磁盘空间监控

磁盘空间是Linux系统中另一个重要的指标,它存储了文件和应用程序。使用Python脚本,可以实时监控系统的磁盘空间使用情况,当磁盘空间使用率超过设定的阈值时,Python程序将触发报警操作。

4、网络监控

网络连通性是Linux系统中一个重要的指标。使用Python脚本,可以实时监控系统的网络连通性,当网络异常时,Python程序将触发报警操作。

三、报警功能

当系统监控指标达到预设的阈值时,Python程序将触发报警功能。常见的报警方式包括邮件、短信、微信等。在本文中,我们将使用邮件报警。需要安装Python的smtplib和email库来实现邮件报警。

四、Python实现代码示例

以下是一个用Python实现Linux系统监控和报警的示例代码:

```
import os
import smtplib
from email.mime.text import MIMEText

# 监控指标阈值
cpu_threshold = 90
mem_threshold = 80
disk_threshold = 80

# 发送邮件的邮箱地址和密码
mail_user = 'example@example.com'
mail_password = 'password'

# 发送邮件的目标邮箱地址
mail_to = 'target@example.com'

def send_mail(subject, message):
    # 设置邮件内容
    message = MIMEText(message, 'html', 'utf-8')
    message['From'] = mail_user
    message['To'] = mail_to
    message['Subject'] = subject

    # 发送邮件
    try:
        smtp_obj = smtplib.SMTP('smtp.gmail.com', 587)
        smtp_obj.ehlo()
        smtp_obj.starttls()
        smtp_obj.login(mail_user, mail_password)
        smtp_obj.sendmail(mail_user, mail_to, message.as_string())
        smtp_obj.quit()
        print('邮件发送成功')
    except Exception as e:
        print('邮件发送失败', e)

def check_cpu():
    # 获取CPU使用率
    cpu_usage = os.popen("top -bn1 | awk '/Cpu/ { cpu = $2 + $4 } END { print cpu }'").readline().strip()
    if float(cpu_usage) > cpu_threshold:
        send_mail('CPU使用率过高', '当前CPU使用率为 %.2f%%,超过阈值 %d%%' % (float(cpu_usage), cpu_threshold))

def check_mem():
    # 获取内存使用率
    mem_usage = os.popen("free -m | awk 'NR==2{printf \"%.2f%%\", $3*100/$2 }'").readline().strip()
    if float(mem_usage.rstrip('%')) > mem_threshold:
        send_mail('内存使用率过高', '当前内存使用率为 %s,超过阈值 %d%%' % (mem_usage, mem_threshold))

def check_disk():
    # 获取磁盘使用率
    disk_usage = os.popen("df -h | awk '$NF==\"/\"{printf \"%d\", $5}'").readline().strip()
    if int(disk_usage) > disk_threshold:
        send_mail('磁盘使用率过高', '当前磁盘使用率为 %s%%,超过阈值 %d%%' % (disk_usage, disk_threshold))

def check_network():
    # ping百度检查网络连通性
    response = os.system("ping -c 5 www.baidu.com")
    if response != 0:
        send_mail('网络不可用', '无法连接互联网,请检查网络连接')

while True:
    check_cpu()
    check_mem()
    check_disk()
    check_network()
```

五、总结

本文介绍了如何用Python实现Linux系统监控和报警功能,帮助管理员及时发现系统问题并解决。在实际应用中,可以根据实际需要修改监控指标阈值,添加或修改报警方式,以适应不同的场景。