
1人SREが朝一ダッシュボードチェックをAIに手伝ってもらいたいのでPoCしている話
BRANK
こんにちは。ご機嫌いかがでしょうか。"No human labor is no human error" が大好きな吉井 亮です。プロダクトの規模が小さいと1人 SRE という体制は珍しくないと思います。1人で何が辛いかというと、相談相手やレビュー相手がいないことです。ですので、最近は AI/LLM に相手をしてもらっています。運用に使っている Lambda 関数や Terraform のコードをレビューしてみたり(※1)、エラー発生時の1次対応をお願いしてみたり(※2)しています。※1 プルリクしたら Bedrock にコードレビューしてもらいたい※2 AIOps入門 AWS Bedrock で障害分析私は毎朝のタスクとして、ダッシュボードチェックを行っています。平日なら前日分、土日祝日なら2〜3日分のメトリクスを眺めながら、異常な挙動はないか、パフォーマンス劣化が起きていないかなどの確認をしています。ただ、1人 SRE の朝一ダッシュボードチェックを以下の心配があります。何の問題もなければ地味で単調なタスクなので、気を抜くと兆候を見逃してしまう可能性は排除できない1人だと考察に多様性が無いなにより1人だと飽きてしまうというころで、朝一ダッシュボードチェックも AI/LLM に手伝ってもらうことにしま…