zabbix 简单使用
登录和配置用户
Zabbix 内创建一个系统用户。
登录
这是 Zabbix 的“欢迎”界面。输入用户名 Admin 以及密码 zabbix 以作为 Zabbix超级用户登录。将授予访问配置和管理菜单的权限。
创建用户
可以在*管理(Administration) → 用户(Users)*下查看用户信息。
点击 创建用户添加一个新用户。
在创建的用户表单中,请确保将你的用户添加到现有的 用户组, 例如 ‘Zabbix administrators’。
我这里用户名填入 user,密码填入 zabbixpwd。注意所有必填输入字段均标有红色星号。
默认情况下,新用户没有为其定义媒介(通知传递方法)。如果要创建,请转到“媒介”选项卡并单击添加。
在此弹出窗口中,输入用户的电子邮件地址。
你可以为媒介指定一个时间活动周期 (参考 时间周期说明 页面,查看该字段格式的描述),默认情况下,媒介一直是活动的。你也可以通过自定义触发器严重等级来激活媒介,但暂时保持所有级别的都处于启用状态。
点击添加保存媒介,然后转到“权限”选项卡。
权限选项卡有一个必填字段角色。该角色决定用户可以查看哪些前端元素,以及允许用户执行哪些操作。点击选择,然后从列表中选择一个角色。例如,选择Admin role以允许访问除管理之外的所有Zabbix前端部分。稍后,你可以修改权限或创建更多用户角色。选择角色后,权限将显示在同一选项卡中:
在用户窗口中点击添加以保存用户。新用户将出现在用户列表中。
添加权限
默认情况下,一个新的用户没有权限访问主机。要授予用户权限,请单击组列中的用户组(在本例中为“Zabbix administrators”)。在“用户群组”窗口中,转到“权限”选项卡。
该用户需要以只读方式访问Linux Server主机组,因此请单击用户组选择字段旁边的选择。
在此弹出框中,选中在“Linux servers”旁边的复选框,然后单击选择。Linux servers就会显示在选择清单中。 单击“Read”按钮设置权限级别,然后添加到权限列表中。 在用户组属性表单中,单点击更新。
在Zabbix中,主机的访问权限被分配给 用户组, 而不是单独的用户。
权限设置完成了! 您可以尝试使用新用户的凭据登录。
新建主机
Zabbix中的主机是一个你想要监控的网络实体(物理的,或者虚拟的)。Zabbix 中,对于主机的定义非常灵活。它可以是一台物理服务器,一个网络交换机,一个虚拟机或者某些应用程序。
添加主机
Zabbix中,可以通过配置 → 主机或者监测 → 主机,查看已配置的主机信息。默认已有一个名为’Zabbix server’的预先定义好的主机。但我们需要学习如何添加另一个。
点击创建主机来新增一台主机。将会展示出一个主机配置表。
所有必填字段均标有红色星号。
至少需要提供以下信息:
主机名
- 输入一个主机名。允许使用大小写字母、数字、空格、点、破折号和下划线。
主机组
- 通过单击选择按钮选择一个或多个现有组,或输入不存在的主机组名以创建新组。
注意:所有访问权限都是分配给主机组的,而不是单个主机。这就是为什么一个主机必须至少属于一个主机组。
接口: IP地址
- 虽然技术上它不是必填字段,但您可能希望输入主机的IP地址。请注意,如果这是Zabbix server的IP地址,必须在Zabbix agent配置文件中指定’Server’参数值。
其他选项 我们暂时使用默认值。
当完成后,点击添加。你可以在主机列表中看到你新添加的主机。
可用性列包含每个接口的主机可用性指标。 我们已经定义了Zabbix代理接口,因此我们可以使用代理可用性图标(上面有‘ZBX’)来判断主机可用性
。
新增监控项
监控项是 Zabbix 中采集数据的基础。没有监控项,就没有数据——因为一个主机中只有监控项定义了单一的指标或者需要获得的数据。
添加监控项
所有的监控项都是依赖于主机的。这就是为什么我们要配置一个监控项时,先要进入配置 → 主机页面查找到新建的主机。
在"新主机"行中,点击监控项这个链接,然后点击创建监控项,将会展示一个监控项配置表。
所有必填字段均标有红色星号。
对于我们的示例,需要提供以下信息:
名称
- 输入CPU load 作为值. 在列表和其他地方,都会显示这个值作为监控项名称。
键值
- 手动输入 system.cpu.load 作为值。 这是监控项的一个技术上的名称,用于识别获取信息的类型。这个特定值需要是Zabbix agent预定义键值的其中一种。
信息类型
- 此属性定义预期数据的格式。对于键值 system.cpu.load , 这个字段会自动设置成 浮点数.
您可能还希望减少监控项历史数据的保留天数为7天或14天。这是一种很好的做法,可以避免数据库保存大量的历史数据。
其他选项 我们暂时使用默认值。
当完成后,点击添加。新的监控项将出现在监控项列表中。点击列表中的详细以查看具体细节。
查看数据
当一个监控项创建完成后,你可能好奇它具体获得了什么值。前往Monitoring → Latest data, 在过滤器中选择刚才新建的主机,然后点击Apply。
同时,第一次获得的监控项值最多可能需要60秒。默认情况下,这是服务器读取变化后的配置文件,获取并执行新的监控项的频率。
如果你在”更改“列中没有看到值,可能到目前为止只获得了一次值。等待30秒以获得新的监控项值。
如果你在没有看到类似截图中的监控项信息,请确认:
- 你输入的监控项”键值“和”信息类型“同截图中的一致
- agent和server都处于运行状态
- 主机状态为“已启用”并且它的可用性图标是绿色的
- 在主机的下拉菜单中已经选择了对应主机,且监控项处于已启用状态
图表
当监控项运行了一段时间后,可以查看可视化图表。 简单图表 适用于任何信息类型为数值型的监控项,且不需要额外的配置。这些图表会在运行时生成。
前往Monitoring → Latest data,然后点击监控项后的”图表“'链接来查看。
新建触发器
监控项只是用于收集数据. 如果需要自动评估收到的数据,我们需要定义触发器。触发器包含了一个表达式,这个表达式定义了数据的可接受的阈值级别。
如果收到的数据超过了这个定义好的级别,触发器将被“触发”,或者进入“问题”状态——从而引起我们的注意,让我们知道有问题发生。如果数据再次恢复到合理的范围,触发器将返回“ok”状态。
添加触发器
为监控项配置触发器,前往配置 → 主机,找到”新增的主机“,点击旁边的触发器 ,然后点击创建触发器。将会展示一个触发器配置表。
对于我们的触发器,需要提供以下信息:
名称
- 输入CPU load too high on ‘New host’ for 3 minutes 作为值。 在列表和其他地方,都会显示这个值作为触发器名称。
表达式
- 输入: avg(/New host/system.cpu.load,3m)>2
这个是触发器的表达式。确认这个表达式输入正确,直到最后一个符号。这个监控项键值(system.cpu.load)用于指出具体的监控项。这个特定的表达式大致是说如果3分钟内,CPU负载的平均值超过2,那么就触发了问题的阈值。你可以查看更多的 触发器表达式语法。
完成后,点击添加。新的触发器将会显示在触发器列表中。
显示触发器状态
当一个触发器定义后,你可能想查看它的状态。
如果CPU负载超过了你在触发器中定义的阈值,这个问题将显示在监测 → 问题中。
状态栏中的闪烁表示最近触发状态的变化,即过去30分钟内发生的变化。
接收问题通知
当监控项收集数据并且触发器处于问题的状态下,在系统中设定告警机制也很有用,这将使我们不需要盯着Zabbix前端也能收到一些重要的事件通知。
这就是通知的功能。电子邮件是最受欢迎的问题通知方式,我们将会学习如何设置电子邮件通知。
电子邮件设置
Zabbix中最开始预定义了一些通知发送方式。 电子邮件是其中的一种。
前往管理 → 媒介类型,点击预定义媒介类型列表中的Email,以配置电子邮件。
这将为我们展示电子邮件设置定义表单。
所有必填字段均标有红色星号。
根据你的环境,设置SMTP服务器,SMTP HELO以及SMTP电子邮件的值。
”SMTP电子邮件“ 将作为Zabbix通知的“发件人”地址。
一切就绪后,点击更新。
现在你已经配置了”电子邮件“作为一种可用的媒介类型。一个媒介类型必须通过发送地址来关联用户(如同我们在配置一个新用户)中做的,否则它将无法生效。
新建动作
发送通知是Zabbix中动作执行的操作之一。因此,为了建立一个通知,前往配置 → 动作,然后点击创建动作。
所有必填字段均标有红色星号。
在这个表单中,为动作输入一个名称。
在最简单的情况下,如果我们不添加任何更具体的条件,动作 将在从“Ok”到“Problem”的任何触发器状态更改时被执行。
我们还需要定义这个动作具体要做什么 —— 即在 操作标签页中执行的操作。点击操作块中的添加,将会打开一个操作表单。
所有必填字段均标有红色星号。
这里,在Send to users块中点击添加并选择我们之前定义的用户(‘user’)。在仅送到中选择Email。在完成后,点击添加,这个操作将会被添加:
这就是一个简单的动作配置,最后点击动作表单中的添加。
接收通知
现在,在配置了发送通知的情况下,实际接收一个通知会很有趣。为了实现这个目的,我们可能会故意增加主机上的负载——这样我们的 触发器才会被触发,然后我们会收到问题通知。
打开主机的控制台,并运行:
1 | cat /dev/urandom | md5sum |
你可能需要运行一个或者多个 这样的进程.
现在,前往监测 → 最新数据,查看“CPU Load”的值是否已经增长。记住,为了使我们的触发器被触发,“CPU Load”的值需要在在3分钟运行的过程中超过2。一旦满足这个条件:
- 在监测 → 问题中,你可以看到闪烁“问题”状态的触发器。
- 你的电子邮件中,会收到一个问题通知。
如果通知功能没有正常工作:
- 再次验证电子邮件设置和动作设置已经被正确配置
- 确认你创建的用户对生成事件的主机至少拥有读权限。正如*添加用户* 步骤中提到的。“Zabbix 管理员”用户组中的用户必须对’Linux servers’主机组(该主机所属组)至少拥有读权限。
- 另外,你可以在报表 → 动作日志中检查动作日志。
新建模板
之前我们学习了如何创建监控项、触发器以及如何获取主机的问题通知。
虽然这些步骤提供了很大的灵活性,但仍然需要很多步骤才能完成。如果我们需要配置上千台主机,一些自动化操作会带来更多便利性。
模版功能可以实现这一点。模版允许对有用的监控项、触发器和其他对象进行分组,只需要一步就可以对监控主机应用模版,以达到重复使用的目的。
当一个模版链接到一个主机后,主机会继承这个模版中的所有对象。简单而言,一组预先定义好的检查会被快速应用到主机上。
添加模板
在开始使用模版之前,你必须先创建一个。在配置 → 模版中,点击创建模版。将会展示出一个模版配置表。
所有必填字段均标有红色星号。
此处需要输入的参数包括:
模板名称
- 输入一个模板名称。允许使用大小写字母、数字、空格和下划线。
主机组
- 通过单击选择按钮选择一个或多个现有组。模板必须属于某个主机组。
完成后,点击添加。你可以在模板列表中看到你新添加的模板。
你可以在这看到模版信息,但里面什么都没有——没有监控项、触发器或其他其他对象。
在模版中添加监控项
在模版中添加监控项,前往“新建主机“的监控项列表。在配置 → 主机,点击“新建主机“旁边的监控项。
然后:
- 选中列表中“CPU 负载”监控项的选择框
- 点击列表下方的复制
- 选择要复制这个监控项的目标模版
所有必填字段均标有红色星号。
- 点击复制
你现在可以前往配置 → 模版,"新模板"模版中会有一个新的监控项。
我们目前只创建了一个监控项,但你可以用同样的方法在模版中添加其他的监控项,触发器以及其他对象,直到满足特定需求(如监控操作系统,监控单个应用)的完整的对象组合。
链接模版到主机
准备好一个模版后,将它链接到一个主机。前往配置→ 主机,点击“新建主机”打开其属性表单,并找到模板字段。
开始在模板字段中键入新建模板。我们创建的模板名称应该出现在下拉列表中。向下滚动选择。查看它是否出现在模板字段中。
单击表单中的更新保存更改。现在,模板和它所持有的所有对象都被添加到主机中。
正如您可能已经猜到的,这种方法也可以应用于任何其他主机。在模板级别对监控项、触发器和其他对象的任何更改都将传播到模板链接到的主机。
链接预定义模版到主机
正如你可能已经注意到的,Zabbix为各种操作系统、设备和应用程序提供了一组预定义的模板。要快速开始监控,您可以将适当的模板链接到主机,但要注意,这些模板需要根据您的环境进行微调。一些检查可能不需要,轮询间隔可能过于频繁。
可参考该链接,查看更多关于模板的信息。