どのシナリオから始めるのが良いですか?
初めてなら初級から始めるのが安全です。ログ確認、設定確認、再起動といった基本の流れを短時間で体験できます。
自分のレベルと題材に合わせて、Web 障害対応の練習を始められます。
初級はログ確認と設定ミスの発見、中級は複数の情報をつなぐ判断、上級は本番に近い復旧判断の練習向けです。
公開シナリオ
6
初級から上級まで、段階を分けて選べます。
練習テーマ
設定 / 復旧
設定ミス、権限、ロールバック、CORS など実務に近い題材を扱います。
おすすめの使い方
短時間反復
一問ずつ解いて、ログ確認と初動の型を体に入れるのに向いています。
デプロイ直後からAPIサーバーが500エラーを返し続けている。ログには「connection refused」の文字が…
想定ロール
オンコール担当エンジニア
到達目標
api-server を復旧し、/health が 200 を返すようにする
新バージョンをデプロイしたら、web-app が起動しない。ログには EADDRINUSE の文字が。
想定ロール
デプロイ担当
到達目標
ポート3000を占有している古いプロセスを終了させ、web-app を起動する
夜間バッチが全て失敗している。エラーは「permission denied」。どのファイルに書き込めていないのか?
想定ロール
運用担当
到達目標
/var/log/app.log への書き込み権限を回復し、batch-worker を再起動する
本番にデプロイしたら、フロントエンドがAPIを叩けなくなった。開発環境ではちゃんと動いていたのに…
想定ロール
フロントエンド担当
到達目標
本番ドメインからAPIを叩いても CORS エラーが出ないようにする
バージョン2.0をデプロイしたのに、ユーザーからは「古い画面が表示される」と報告が。hard reload しても直らない。
想定ロール
リリース担当
到達目標
キャッシュをクリアし、新しいビルドが配信されるようにする
初めて触る人が迷いやすいポイントを先にまとめています。
初めてなら初級から始めるのが安全です。ログ確認、設定確認、再起動といった基本の流れを短時間で体験できます。
あります。環境変数ミス、CORS、ロールバック失敗、権限周りなど、Webサービス運用で起きやすいテーマを揃えています。
初級は 8 〜 10 分前後、中級は 10 〜 15 分前後、上級は 15 分以上を目安にしています。