prometheus 2.0.0 アラートルール

vim monitor.rule.yml

groups:
- name: example
  rules:

  # Alert for any instance that is unreachable for >5 minutes.
  - alert: InstanceDown
    expr: up == 0
    for: 10s
    labels:
      severity: page
    annotations:
      summary: "Instance ææ $labels.instance åå down"
      description: "ææ $labels.instance åå of job ææ $labels.job åå has been down for more than 10 seconds."

expr でトリガー ステータス up が 0 のまま 10 秒経過したらアラート通知を行う という内容。

これを prometheus の方の設定ファイルでルールファイルとして指定する。

vim prometheus.yml

rule_files:
   - "monitor_2.rules.yml"

記載の場所は恐らくどこでも大丈夫だとおもいます。

アラート通知をトリガーにメールを送信したい場合は alertmanager ツールを公式からダウンロードしてくる感じです。