Keep 简介
Keep[1] 是一个开源的告警管理和AIOps平台,提供一站式的告警管理解决方案。它通过告警去重、丰富、过滤和相关性分析,以及与监控工具的双向集成、工作流和仪表板,帮助用户有效管理和响应告警。

项目特点
主要特点
-
单窗格视图:为所有告警和事件提供最佳可定制的用户界面。 -
告警的瑞士军刀:去重、相关性分析、过滤和丰富信息。 -
深度集成:与监控工具的双向同步和可定制的工作流。 -
自动化:为你的监控工具提供GitHub Actions。 -
AIOps 2.0:AI驱动的相关性和总结。
使用场景
Keep支持多种监控工具、数据库、通信平台、事件管理工具和工单工具的集成,使其适用于需要集中管理和响应告警的多种场景,包括但不限于:
-
监控系统的告警管理。 -
跨平台的告警集成和自动化处理。 -
事件管理和响应的自动化工作流。
项目使用
Keep通过工作流实现告警和事件管理的自动化。一个Keep工作流是一个声明式的YAML文件,包含触发器、步骤和动作:
-
触发器:启动工作流的事件(告警、事件、计划或手动)。 -
步骤:读取或获取数据(丰富、上下文)。 -
动作:执行操作(更新工单、发送通知、重启服务器)。
例如,以下是一个简单的工作流,它为来自Sentry的critical
告警创建Jira工单,这些告警针对payments
和api
服务:
workflow:
id: sentry-alerts
description: 创建针对Sentry的critical告警的工单
triggers:
- type: alert
filters:
- key: source
value: sentry
- key: severity
value: critical
- key: service
value: r"(payments|ftp)"
actions:
- name: send-slack-message-team-payments
if: "'{{ alert.service }}' == 'payments'"
provider:
type: slack
config: " {{ providers.team-payments-slack }} "
with:
message: |
"来自Sentry的新告警:告警:{{ alert.name }} - {{ alert.description }}
{{ alert}}"
- name: create-jira-ticket-oncall-board
if: "'{{ alert.service }}' == 'ftp' and not '{{ alert.ticket_id }}'"
provider:
type: jira
config: " {{ providers.jira }} "
with:
board_name: "Oncall Board"
custom_fields:
customfield_10201: "Critical"
issuetype: "Task"
summary: "{{ alert.name }} - {{ alert.description }} (由Keep创建)"
description: |
"此工单由Keep创建。
请查看下面的告警详情:
{code:json} {{ alert }} {code}"
enrich_alert:
- key: ticket_type
value: jira
- key: ticket_id
value: results.issue.key
- key: ticket_url
value: results.ticket_url
参考文档
-
平台文档[2] -
工作流示例[3]

注:本文内容仅供参考,具体项目特性请参照官方 GitHub 页面的最新说明。
欢迎关注&点赞&在看,感谢你的阅读~
Github地址: https://github.com/keephq/keep
[2]
平台文档: https://docs.keephq.dev
[3]
工作流示例: https://github.com/keephq/keep/tree/main/examples/workflows
原文始发于微信公众号(AIGC创想者):7.6K+ Star!Keep:一个开源告警管理和AIOps平台
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/314836.html