アマゾンのクラウドサービス、大規模障害から「復旧」 SNSや銀行アプリなどに影響
米アマゾンのクラウドサービス「アマゾン・ウェブ・サービス(AWS)」で20日、大規模な障害が発生し、世界最大級のウェブサイトの多くが接続不能となった。アマゾンは同日夜、この障害を解消したと発表した。
アマゾンによると、スナップチャットのようなソーシャルメディア・プラットフォームや、ロイズ銀行やハリファックス銀行といった金融機関を含む1000以上のアプリやウェブサイトが、AWSの中枢機能に発生した問題の影響を受けたという。
障害監視サービス「ダウンディテクター」は、20日の障害発生中、世界中からの問題報告件数が1100万件を超えたと明らかにしている。
専門家らは今回の障害について、多くの企業が単一かつ支配的なプロバイダーに依存していることの危険性を浮き彫りにしたと指摘している。
英サリー大学のアラン・ウッドワード教授は、「今回の事例が浮き彫りにしたのは、われわれのインフラがいかに相互依存的であるかという点だ」と述べた。
「非常に多くのオンラインサービスが、物理的なインフラを第三者に依存している。今回の事例は、そうした第三者の中でも最大規模のプロバイダーにおいてさえ、問題が発生する可能性を示している」
「小さなミス、しばしば人為的なものが、広範かつ重大な影響を及ぼす可能性がある」
AWSの障害は、日本時間の20日午後3時ごろに始まったとみられ、複数のプラットフォームへのアクセスに関する問題が、ユーザーから報告され始めた。
対象には、「フォートナイト」のような大規模なオンラインゲームから、語学学習アプリ「デュオリンゴ」に至るまで、幅広い種類のサイトやサービスが含まれていた。
ダウンディテクターはBBCに対し、わずか数時間で500件のサイトに関する報告が400万件以上寄せられたと説明。これは通常の平日の全体件数の2倍以上だという。
その後、掲示板サイト「レディット」やロイズ銀行など、さらなるサービスが復旧を試みる中で、報告件数は1100万件を超えてピークに達したと、同サービスは明らかにしている。
アマゾンは、日本時間21日午前7時ごろ、「多くの影響を受けたサービスが復旧した」と発表。しかし根本的な問題に対処するためには、自社システムの一部に制限をかけなければならなかったとした。
仏ノートルダム大学のマイク・チャップル教授(情報技術)によると、最初の障害の後に、新たな「連鎖的な障害」が発生した可能性があるという。
「これは、大規模な停電が起きたときのようなものだ」と、チャップル氏は述べた。「作業員が復旧に取りかかると、電力が何度か戻ったり消えたりすることがある。しかし、それは『症状』に対処しただけで、『根本原因』には対処していない可能性がある」
■何が起こったのか
アマゾンは、20日に発生した障害の原因について、詳細を明らかにしておらず、これに関する公式声明も出していない。
同社は、サービス状況を伝えるウェブページの更新情報の中で、今回の問題について「米東部リージョン(US-EAST-1)におけるDynamoDB APIエンドポイントのドメイン・ネーム・システム(DNS)解決に関連している可能性がある」と説明している。
DNSは、インターネット上の電話帳に例えられることが多い。これは、利用者が使用するウェブサイト名(例えば bbc.com)を、コンピューターが読み取って理解できる数値に変換する役割を果たしている。
このプロセスは、インターネットの利用方法の根幹を成しており、これに障害が発生すると、ウェブブラウザーが目的のコンテンツを見つけられなくなる可能性がある。
クラウドフレアのマシュー・プリンス最高経営責任者(CEO)はBBCに対し、今回のAWSの障害は、クラウドサービスがインターネットの仕組みに対して持つ影響力を浮き彫りにしたと語った。
「誰にでも悪い日はある。今日はアマゾンにとって、その日だった」と、プリンス氏は述べた。
「クラウドには素晴らしい点がある。拡張性を実現できる。(中略)しかし、今回の障害が発生すれば我々が依存している多くのサービスが停止する可能性がある」
フューチャー・オブ・テクノロジー研究所のコリ・クライダー代表はBBCに対し、「まるで橋が崩壊したようなものだ」、「経済の中核的な部分が崩れ落ちた」と語った。
クライダー氏はまた、クラウドコンピューティングの大部分がアマゾン、マイクロソフト、グーグルに依存しており、その割合は約70%に上るとされる中で、現状は「持続不可能だ」との見方を示した。
「供給が少数の独占的なプロバイダーに集中してしまえば、今回のような事態が発生した際に、経済の大部分が一緒に機能不全に陥る」
「アメリカの独占的なプラットフォーム数社に依存するのではなく、より地域に根ざしたサービスの利用を検討すべきだ」
「これは我々の安全保障、主権、そして経済に対するリスクだ。こうした衝撃に対して市場を強くするためには、構造的な分離を検討する必要がある」
■企業のバックアップ体制にも問題と専門家
一方、責任の一端はAWSを利用する企業側にもあると指摘する専門家もいる。
「アマゾンを利用している企業は、自社のアプリケーションに保護システムを組み込むための十分な対策を講じてこなかった」と、米コーネル大学のケン・バーマン教授(コンピューター・サイエンス)は述べた。
今回のような障害は頻繁に起きているが、大規模なものばかりではない。
バーマン教授はBBCに対し、アプリ開発者は、クラウド上で稼働する重要なアプリケーションについて、バックアップ体制の整備に注意を払うべきだと述べた。
「こうしたシステムをより強固にする方法は分かっているし、安全にそれを実現する方法も分かっている」と、バーマン教授は語った。
こうした事態の責任の所在をめぐっては、法廷での争いになる可能性もある。
たとえば米デルタ航空は、昨年発生したサイバーセキュリティー企業「クラウドストライク」の障害をめぐり、1年以上が経過した現在も、5億ドル(約760億円)を超える損失の補填(ほてん)に関して同社との交渉を続けている。
クラウドストライクが問題を修正した後も、デルタ航空は4万台のサーバーを手動で再起動する必要があり、数日にわたって大規模なフライトの遅延が発生したとしている。