お知らせ

お知らせ

運用上のすべての障害から学ぶ

システムの運用中に起こるすべての出来事や問題(障害)から学びます。学んだことを基に、システムや手順をより良くするための改善を進めます。これらの学びをチームの中だけでなく、会社全体で共有して、皆がその教訓を活かせるようにします。
お知らせ

障害を予想する

システムに問題(障害)が発生した場合に備えて、その問題の原因を見つけて解決するための練習を行います。具体的には、問題が起こる可能性のあるシナリオ(状況)を考えて、そのシナリオを使ってテストを行い、どんな影響が出るかを確認します。また、問題に...
お知らせ

運用手順を定期的に改善する

常に最良の運用手順を考えます。運用手順は定期的に見直して改善できるように計画を立て、決まったスケジュールでその手順が効果的に動作しているかを確認します。そして、チームメンバーがその手順を十分に理解していることも確認します。
お知らせ

小規模かつ可逆的な変更を頻繁に行う

システムに変更を加える場合、もし変更が失敗してもすぐに元に戻せるように、まずは小さな部分から変更を始めます。また、できる限りお客様に影響が出ないように工夫します。
お知らせ

運用をコードとして実行する

システムの操作方法をプログラム(コード)として書いておくことで、そのコードがきっかけ(トリガー)となり、自動的に必要な操作が実行されます。これにより、人的ミスが減り、システムの運用が効率的になります。