19万台超のHDD運用データから算出された故障率レポートの2021年Q3版をBackblazeが公開

19万台超のHDD運用データから算出された故障率レポートの2021年Q3版をBackblazeが公開

クラウドストレージサービスを提供するBackblazeが、自社のデータセンター上で運用している19万台超のストレージの運用データを基に、2021年第3四半期(7~9月)におけるHDDの故障率データを公開しました。

Backblaze Drive Stats for Q3 2021

2021年9月30日時点で、Backblazeは2つの大陸で合計4つのデータセンターを運営しています。これらのデータセンターでは19万4749台のストレージを運用しており、このうち3537台がブートドライブで、19万1212台がデータドライブとして利用されています。ブートドライブのうち1557台がHDDで、1980台がSSD、データドライブはすべてHDDです。なお、データドライブのうち386台はテスト用と台数が60台未満のモデルであったため検証対象から除外されており、最終的な故障率は19万826台の運用状況から算出されています。

2021年第3四半期における故障率をまとめた表が以下。検証対象となったストレージはデータドライブとして運用されている19万826台で、2021年第3四半期におけるHDDの通算運用日数は1703万1430日、故障したHDDの合計は515台で、通算の年間平均故障率(AFR)は1.10%です。2021年第2四半期には約1年ぶりにAFRが上昇(1.01%)していますが、今期もさらにAFRが上昇したという結果に。

Backblazeが運用したHDDのうちAFRで0%を達成したのは、HGSTの12TB「HUH721212ALE600」のみ。60台以上運用されていたHDDのうち、故障したのが1台のみのHDDはHGSTの12TB「HUH728080ALE600」、Seagateの6TB「ST6000DX000」、東芝の4TB「MD04ABA400V」、東芝の14TB「MG07ACA14TEY」、WDCの16TB「WUH721816ALE6L0」の5モデルのみ。中でも「ST6000DX000」は平均稼働年数が77.8カ月、「MD04ABA400V」が平均稼働年数が75.6カ月と非常に長いため、「称賛に値する」とBackblaze。

BackblazeはブートドライブとしてSSDとHDDを利用しており、その中で「SSDはHDDよりも本当に信頼性が高いのか?」という疑問を検証するために、SSDのAFRも四半期ごとに算出しています。以下のグラフはHDD(青線)とSSD(赤線)のAFR。SSDの方がわずかにAFRが低いものの、HDDの運用開始から4年間(2014~2017年)のAFRと、SSDの2018~2021年第3四半期までのAFRの推移は非常に似たものとなっています。HDDの運用年数が長くなってきたタイミング(2018年)からAFRが一気に上昇したため、SSDのAFRが今後どのように変化するかは要チェックです。

以下は、2013年4月から2021年9月30日までの期間で集計した、2021年9月30日時点で稼働しているHDDの生涯故障率を示した表。運用中のすべてのHDDのAFRは減少し続けており、「1.43%」というAFRの価は2013年に集計を開始して以来最低値になるとのこと。

HDDの生涯故障率統計から明らかになった、容量別の最もAFRが低いHDDは、16TBが東芝の「MG08ACA16TEY」、14TBがWDCの「WUH721414ALE6L4」、12TBがHGSTの「HUH721212ALE600」、10TBがSegateの「ST10000NM0086」、8TBがHGSTの「HUH728080ALE600」、6TBがSegateの「ST6000DX000」、4TBがHGSTの「HMS5C4040BLE640」でした。

HDD故障率のメーカー・モデル別統計データ2021年版、故障率が最も高かったのは?

クラウドストレージサービスを提供するBackblazeが、自社のデータセンターで使用している20万台以上ものHDDの故障率をまとめたデータの2021年版を公開しました。

Backblaze Drive Stats for 2021

Backblazeは2021年だけで4万460台もの新たなHDDを追加し、2021年12月31日の時点で合計20万6928台ものHDDを管理していたとのこと。このうち、ブートドライブとして使用されていたものやテスト用に使用されたものを除いた、合計20万2759台のデータドライブに焦点を当てて、BackblazeはHDDの故障率を算出しました。

2021年1月1日~2021年12月31日のHDD故障率をモデル別で示したものがこれ。運用しているHDDは24モデルにわたり、全体の年間故障率(AFR)は1.01%でした。

全モデルの中で最も低い年間故障率を誇るのはSeagateの6TBモデル「ST6000DX000」で、年間故障率はわずか0.11%でした。「ST6000DX000」の「Avg.Age(平均稼働日数)」は全モデルの中で最長の80.85カ月であることを考えると、この結果はことさら際立っているとBackblazeは指摘しています。なお、「ST6000DX000」は2020年のHDD故障率統計においても、全モデルの中で最もAFRが低いHDDとなっています。

一方、最も年間故障率が高いのはSeagateの14TBモデル「ST14000NM0138」で、年間故障率は4.79%でした。「ST14000NM0138」が想定以上の頻度で壊れることについては、BackblazeだけでなくSeagateやDellも頭を悩ませていたとのことで、障害が発生したHDDは専門家によって調査され、2021年の第3四半期にファームウェアアップデートが行われました。その結果、2021年第3四半期の故障率は6.29%だったのに対し、第4四半期の故障率は4.66%に低下したとのこと。

2021年に発売された新モデルについて見てみると、東芝の16TBモデル「MG08ACA16TE」とWDCの16TBモデル「WUH721816ALE6L0」のいずれも、平均稼働日数こそ少ないもののAFRは1.01%を下回っています。Backblazeは、「2021年の新しいモデルはどちらも好調です」とコメントしていました。

また、2019年、2020年、2021年のHDD故障率統計を並べたものがこれ。年間故障率は2019年が1.89%、2020年は0.93%、2021年は1.01%と、2019年からは大幅に年間故障率が低下していることがわかります。

HDD故障率をメーカー別に比較したグラフがこれ。Seagate(緑)や東芝(青)は比較的変動が激しい一方、HGSTは低い水準で安定しているように見えます。

HDD故障率をストレージ容量ごとに比較した以下の表を見ると、12TBを超える大容量HDDでの故障率が低い傾向があることがわかります。HDD全体のうち12TB以上の割合は69%であり、合計稼働日数の66%を占めている一方で、全体のHDD故障に占める割合は57%にとどまっているとのこと。

なお、Backblazeが運用するモデルの種類をメーカーごとに分類したグラフがこれ。2021年はHGST(青)が6種類、Seagate(緑)が11種類、東芝(赤)が5種類、WDC(黒)が2種類となっています。

上のグラフを見ると全体としてSeagateのモデルが増加しているのかと思われそうですが、全体に占めるHDD割合比をメーカー別に示した以下のグラフを見ると、4メーカーの差が時間と共に縮まっていることがわかります。特に、2019年の時点で全体の70%を超えていたSeagate製HDDの割合が、2021年第4四半期には50.13%まで低下しており、代わりに2019年第1四半期には1.31%しかなかった東芝製HDDの割合が、2021年第4四半期には23.24%まで上昇しています。HDDを複数のメーカーに分散する理由について、Backblazeは「モデルの数を増やすのと同様に、柔軟性を向上させるためです。全ての主要なHDDベンダーとの関係を持つことは、私たちが必要なリソースをタイムリーに得る機会を与えてくれます」と述べました。

2021年12月31日時点で製造中の全HDDモデルについて、2013年4月20日~2021年12月31日の期間で年間故障率を算出したものが以下。グラフ右側の「Confidence Interval」という項目は、「Low」と「High」の値が小さいほど年間故障率の信頼性が高いことを示しています。

🍎たったひとつの真実見抜く、見た目は大人、頭脳は子供、その名は名馬鹿ヒカル!🍏