Google Cloud、API問題による大規模な障害の詳細を発表
Google Cloudは、APIのコード問題によって発生した大規模な障害の原因を詳しく説明する報告書を発表した
最新の更新
Google Cloudは、最近発生した大規模なシステム障害の詳細を説明する報告書を発表した。該当障害はSpotifyやCloudflare、Discordなどのサービスを含む広範囲なオンラインサービスに影響を与えた。
伝えられたところによると、原因はGoogleのAPI管理システムの一部であるService Controlのコード問題であり、無効な自動クォータ更新と不適切なエラー処理が重なって、全世界のシステムでクラッシュループを引き起こし、Google CloudのサービスやそのAPIを利用する外部サービスでも503エラーが発生した。
大抵の地域は40分程度で復旧したが、一部のリージョンではより長い時間を要した。Googleは今後の障害を防ぐための改善と、通信の向上を継続する方針を示している。