環境変数ミスで 500 エラーが出るときに最初に見るポイント
環境変数の typo や未設定は、障害対応の初動でかなり出会いやすいパターンです。
しかも「500 が出た」だけでは、アプリ本体の不具合なのか、設定差分なのかがすぐ分からないことが多いです。
このページでは、incident-sim の訓練導線に寄せて、最初に何を見るべきかを整理します。
まず確認する順番
迷ったら、次の順番で見ます。
- 直前の変更に環境変数まわりが含まれていないか
- 必須の環境変数が欠けていないか
- 値の typo、空文字、桁違いがないか
- 本番と検証で参照元がずれていないか
- 失敗ログに
missing,undefined,invalidのような兆候がないか
ありがちな詰まりどころ
- デプロイ時に
.envの値だけ更新されていない - シークレット名を変えたのに参照コードが古いまま
- 数値や URL のフォーマットが環境ごとに違う
- ロールバック時に古い設定へ戻っていない
訓練で身につけたいこと
incident-sim でこのテーマを触る意味は、答えを覚えることではありません。
- 設定変更を疑うタイミング
- ログと設定を往復する順番
- 共有時に「どこまで確認できたか」を短く伝える力
この三つを反復で固めることが重要です。
次に試すとよい導線
incident-simのシナリオ一覧で初級から 1 本選ぶ- CORS やロールバック失敗のガイドも見て、似た初動との差を比べる
- 結果画面で、確認順が飛んでいないかを振り返る
設定ミスは地味ですが、初動の質がそのまま出ます。
だからこそ、障害対応の練習テーマとして価値があります。
[ ./next_action ]
読んだら、 Web本番障害シミュレーター を実際に動かす。
この開発ログは Web本番障害シミュレーター をどう作ったかの記録です。 読み終わったらそのままサービス本体へ戻って、 実物で価値を確かめてください。