前職であるペパボでは @hiboma が開発、運用していたsssbotというインシデント対応支援を行うSlackボットが存在しました。
詳細は下記の資料が詳しいです。
sssbotの機能として、僕が便利に思うことは3つあります。
- 自動で障害対応チャンネルが作成されて、必要なチャンネルに勝手に通知する
- 障害対応チャンネルにインシデントレンスポンスチームを呼びつける
- ポストモーテムの自動作成や、インシデントハンドラーの取り決めなど障害対応のワークフローが自動化されている
現職に入って、いままで当たり前にあったこの機能がなくて、喪失感を感じていたり、あとは所属部署の目標としてインシデントマネージメントもあったため、ないものは作るかということで書き始めた。厳密にはこの間に様々あったが、それは居酒屋で聞いて下さい。
大体できたあとに、ふとこれ、ほぼパクリやけど公開していいんか?という心のざわつきがあったので、 @hiboma に確認したところ、快諾してもらえたので公開しました。
バックエンドはDynamoDBを利用しています。Repository周りはまだちょっとグチャッとしてるけど、動く。
使い方
1. メンションで呼ぶ

2. フォームを入力する

3. チャンネルを作って、人を呼んで、ハンドラーを募集する

4. 我、ハンドラーなり

5. 障害対応をする

6.インシデントレベルを決めましょう


moznionならこうする

他のチャンネルにも通知が飛んでいる。

7.ともあれ復旧だ

8.ポストモーテムを作ろうじゃないか
ピンを打って


AIが何かを生成してくれる

タイムラインもいい感じに

今後について
現状、ポストモーテムの出力先はConfluenceとSlackだけ対応している。自社で運用できるようにあれこれカスタムしながら、末永く触っていこうと思っています。
最後に、公開を快諾してくれた @hiboma に大感謝!!!!1