sudoもrebootも効かないLinuxサーバをなんとか再起動する時のメモ
BRANK

概要 色々ドライバを弄っていたところ、カーネルの共有ワークキューである events_unbound が長時間ブロックされ、そのワーク項目が RTNL を保持したまま離さない状況に陥りました。 具体的には後続のカーネル処理がワークキュー上で滞留し、D state のプロセスが連鎖的に累積しました。 大変残念なことに、D state は割り込み不可の I/O 待ち状態のため kill -9 でも終了させられません。sudo も sudo reboot も応答せず、IPMI にも触れない状態に追い込まれました。 最終的に、生きていた rootを持ってる Docker コンテナに docker ex…

takeio.hatenablog.com
Related Topics: Linux