トップに戻る
DiscordやPixivが鯖落ちした原因は?「Cloudflare」とは…
 > 
トレンド > 
コラム > 
HOME > 
2022/06/21
2023/08/13

DiscordやPixivが鯖落ちした原因は?「Cloudflare」とは…

6/21、日本国内でも人気が高いDiscordやPixivのサービスが、エラーの多発により利用できなくなるトラブルが発生しました。これに対し、「○○のサーバが落ちた!○○最悪!運営無能!」となっている方が一定数いますが、実はDiscordやPixivは一切悪くないのです。今回は、こういったサービスが接続障害に陥る原因について解説していきます。

接続障害はなぜ起きた?

まず、DiscordやPixivで起きた接続障害の理由についてお話します。

一言でいうと、「CloudflareというDiscordなどのインフラサービスのサーバが落ちた」のが原因です。サーバが落ちているという表現は間違ってはいないですが、ここで重要なのはDiscordやPixivが管理しているサーバがダウンしているわけではない点

今回の件に関して該当サービスを批判することは、地震が起きて住宅が倒壊した際に不動産会社に「あんたらちゃんと管理しないからだぞ!管理不備だ!」と文句を言うくらい理不尽なことなので、該当サービスに非がある、という認識は正しくありません。不動産会社が悪いでのなく、地震が起きたのが全て悪いということです。

Cloudflareって何?

Cloudflareとは、日本国内のみでなく、世界中で利用されているトップクラスのシェアを持つインフラサービスです。以下のデータは2020年で少し古いものですが、Amazonが提供しているサービスよりもシェアが高いくらい人気があることがわかります。

出典:2020 CDN Industry: Trends, Size, And Market Share

主なサービス内容は、

  • CDN(ネットワーク)提供
  • セキュリティサービス提供

の2点になります。

私は専門家ではないですし、これも専門家向けの記事ではないため、専門的な話は避けますが、ひとまずは「めちゃくちゃ安定していてめちゃくちゃ安くてめちゃくちゃセキュリティ強くできて、すごいしっかりしたWEBサイトを作れる!最強!」というイメージを持っておいてください。

非常に便利なもので、サービスの信用度を高めるためにも有用なサービスなのは確かです。しかし、Cloudflareの恩恵を受けるためには、Cloudflareが提供するネットワーク上でコンテンツを配信する必要があります。

例え方としては少しアレですが、「安全な場所に住みたい」と思うなら、刑務所に住んでいれば警察にも守ってもらえて安全ですよね。自分の家に住みながら、常に自分の家を警察に守ってもらうというのは、難しいものです。ただし、安全なはずの刑務所も、警察という組織自体が一時的に解散してしまうと、意味のない建物になります。

つまり、ネットワークサービスを管理している大元のCloudflareが落ちると、そのネットワーク上で提供されているサービスまで利用不可能になってしまうのです。

どうして企業は対策していないの?

ここまでの説明を見て、「いや、ネットワークで接続障害が起きても、ユーザが利用できるように何か対策はできるんじゃないの?」と思っている方もいると思います。

私はそこまでインフラ構築やサーバ運用に詳しいわけではないですが、もちろん、そういった対策をすることもできなくはないです。というより、接続障害が起きた際、できる限りすぐにサービスを復旧させたり、サービスの信用性を下げないよう対応マニュアルを整備していたりする企業が多くあります。DiscordやPixivも、恐らくそれくらいは対策しているでしょう。

ただ、「ネットワークで接続障害が起こること」というのが、そもそもイレギュラーというか、あまり意識してされていない事象だと言えます。

例えるなら、誰かと旅行に行くときに、「地球がなくなったら旅行に行けないな・・・」と考えてる人がいるでしょうか。我々の感覚として、地球はあって当たり前のものですが、別に突然爆発したり、隕石が落ちてきたりしてなくなってしまう可能性も、ゼロというわけではないですよね。

まあ、少し無理のある例え方だと思いますが、Cloudflareを利用する側としても、「まあ、大丈夫やろ!障害なんてそんなしょっちゅう起こらんし!ヨシ!」ぐらいの感覚なので、”ネットワーク障害が起きないよう対策する”ということがほとんどありません。

そもそも、そういった障害への対策にも維持費・コストがかかるため、1年に1度起きるか起きないか程度の障害のために高いお金をかけて万全の対策を施す必要があるかというと、難しいところです。

どうしてCloudflareを使うの?

Cloudflareが停止すると、サービスそのものが利用できなくなってしまう。これは、運営会社にとってとてつもない痛手ですよね。こういったリスクがある中で、「どうして外部のサービスに頼るの?」、「自社で作れば良くない?」と思った方もいるかもしれません。しかし、現実はほとんどの企業でCloudflareをはじめとしたインフラサービスが用いられているのです。

各社がCloudflareを利用する理由としては、以下の2つが挙げられます。

  • 自社で対処するだけのメリットがない
  • コストがあまりかからない

自社で対処するメリットがない

まず、そもそもの話として、Cloudflareの代わりとなるインフラシステムを自社で構築するメリットはありません。Cloudflareが利用されているのは、「品質が高いから」です。単にパフォーマンが高いだけでなく、2014年ごろには最もDDOS攻撃を防げるセキュリティシステムとして注目された実績もあります。

正直なところ、Cloudflareに代わるようなシステムを作れる企業はごくわずかです。GoogleやMetaほどの企業であれば作れると思いますが、DiscordやPixivの運営会社がゼロからこういったシステムを構築できるか、技術的にも不安要素があります。また、もし数年間かけてシステムを作り上げたとしても、それを作るまでに膨大な費用がかかり、さらにそれらを保守・運用していく中でも追加で多くの出費が発生してしまいます。

Cloudflareを利用すれば、これらの労力を全て外部企業に丸投げできてしまうわけですから、「外部に頼らず自社で頑張ってシステムを構築しよう!」という話になることがまずありません。

コストがあまりかからない

外部のサービスを利用する場合、各社で必ず検討されるのが費用の問題です。Cloudflareをはじめ、人気のサービスは利用する上での費用・コストが安いという大きな利点があります。安くて手軽に導入でき、かつ製品そのものの品質も高水準なので、日本国内外で幅広く人気を得ているわけです。

過去に起こった大規模障害事例

CloudflareをはじめとしたCDNのの大規模障害は、実は今回が初めてではありません。さまざまなことが原因で、今までに何度か大規模障害を引き起こしています。最後に、そういった大規模障害の事例を2つご紹介します。

1.サービスの50%が停止 (2020/07/17)

2020年7月17日、Cloudflareを利用しているサービスの50%が停止する大規模障害が起きました。先述した大規模障害でも犠牲者となったDiscordをはじめ、さまざまな大型サービスが停止したようです。

原因は、良かれと思って行われたルータの設定変更。設定を変更した結果、既存のプログラムが意図しない形で作動してしまい、一か所に全てのデータが送信される仕組みになって各所のサービスが停止しました。

2.Discord大迷惑 (2019/6/24)

何度も何度も大規模障害に巻き込まれているDiscordは、2019年にも同じような障害の被害者となりました。これもCloudflare側に問題があって起こった障害ですが、実はCloudflareのサーバには特に異常がなかったそうです。

では何が原因だったかというと、Cloudflareが利用していたBGPというサービスが悪さをしていました。BGPは要するにデータが最短経路でやり取りされるようサポートするシステムで、高速通信を実現するための手助けをするのが役割です。しかし、このときのBGPは「私たちの会社のサーバを経由するのが最適」というルールをシステムにつけてしまい、Cloudflareに関するほぼ全ての通信がBGPの運営会社を経由した結果、無事に運営会社のサービスがダウン。Cloudflareも、巻き添えを食らう形で自社サービスが機能不全に陥ってしまったようです。

CDNの管理会社が利用しているサービスが停止した場合も、同様にCDNが停止してしまう可能性があるというのは、非常に怖いですよね。

まとめ

インフラサービスとして、国内でも多くのサービスから利用されているCloudflare。しかし、そのCloudflareに障害が起きてしまうと、サービス全体がストップしてしまうことになります。今回私が伝えたいのは、「Cloudflareに頼るのはダメ」ということではなく、「サービスの障害は運営会社の責任ではないんだよ」ということです。運営会社も被害者ですから、サービスが利用できないからといって、過度に運営会社をたたくのはやめましょう。

SHARE