Suiは5月29日、メインネットのネットワーク停止を再び経験しました。これは、バリデーターインフラのソフトウェアバグに起因する以前の障害からブロックチェーンが活動を再開してからわずか数時間後のことです。
Suiチームはポスト上でこの新たな障害を確認し、エンジニアが問題を調査している間、「現時点でネットワーク活動が一時停止される可能性がある」と警告しました。
今回の最新インシデントは、5月28日に発生したほぼ6時間にわたる障害に続くもので、ネットワーク全体でメインネットの決済が一時的に停止しました。
Suiの公開ステータスページによると、以前の障害は5時間55分続きました。これはメインネットの決済に影響を与えた「重大な障害」に分類されています。
バリデーターの復旧には協調的なソフトウェアアップグレードが必要だった
Suiは以前、ネットワークの1.72リリースで導入された「ガスチャージロジックのクラッシュバグ」を特定した後、ネットワーク活動が再開したと述べていました。
ステータスページのタイムラインによると、問題は5月28日の太平洋時間16:00過ぎに最初に報告され、その約20分後にエンジニアが問題を特定しました。
Source: Sui Status太平洋時間翌5:40頃、Suiはバリデーターへの修正プログラムの展開が進んでいると述べました。ネットワークはその後、「ステークの2/3超が修正版にアップグレードした」後に活動が再開されたことを確認し、復旧にはコンセンサスを回復するためのバリデーターの協調参加が必要だったことを示しています。
チームは再起動後も追加の問題がないかネットワークの監視を継続すると述べました。
ステータスデータはRPCノードが稼働を維持する中でバリデーターの障害を示した
インシデント中に公開されたインフラデータは、障害が主にパブリックRPCアクセスではなくバリデーターの運用に影響を与えたことを示唆しています。
Suiの稼働率ダッシュボードは、バリデーターサービスが重大な障害を経験した一方で、パブリックRPCノードは同期間中も100%の稼働率を報告し続けていたことを示しました。
この違いは、トランザクション決済とバリデーターのコンセンサスが中断されていた間も、ユーザーやアプリケーションがパブリックネットワークエンドポイントに引き続きアクセスできた可能性があることを示しています。
この再発した停止は、ネットワークが数時間前に活動を再開した直後に、より広範な運用上の疑問を提起しています。
協調的な復旧作業後に繰り返される中断は、ネットワーク全体のインシデント時のソフトウェア展開手順、バリデーターの同期、および復旧の信頼性に対する追加の精査をもたらす可能性があります。
Suiは、完全なインシデントレビューを近日中に公開すると述べました。
最終まとめ
- Suiは、ソフトウェアバグに起因する以前のバリデーター障害から活動を回復してから数時間後に、再びネットワーク停止を経験しました。
- ステータスデータは、以前の障害がほぼ6時間続き、ネットワークが再開する前にバリデーターステークの3分の2超がアップグレードする必要があったことを示しました。
Source: https://ambcrypto.com/sui-faces-renewed-network-stall-hours-after-validator-coordinated-recovery/








