10 月 20 日消息,自 2013 年以來,云備份與存儲服務公司 Backblaze 持續追蹤其數據中心內硬盤驅動器(HDD)的年化故障率(AFR)。經過十余年的數據積累,該公司得出了一個明確結論:現代硬盤“使用壽命更長”,且出現的錯誤也更少。

這一結論出自上周由 Backblaze 博客運營專家 Stephanie Doyle 和首席技術布道師 Pat Patterson 聯合撰寫的一篇博客文章。兩位作者將當前數據中心中約 317,230 塊硬盤的年化故障率,與 2013 年監測的 21,195 塊硬盤以及 2021 年分析的 206,928 塊硬盤的數據進行了對比。他們指出:“與前兩次分析相比,我們在硬盤故障發生的年齡分布和故障率峰值上都觀察到了相當顯著的偏離。”

具體數據顯示,2025 年硬盤故障率的峰值出現在使用約 10 年零 3 個月時,僅為 4.25%;相比之下,2013 年的峰值高達 13.73%,出現在使用約 3 年零 3 個月時;而 2021 年的峰值為 14.24%,出現在使用 7 年零 9 個月。這意味著,當前硬盤在生命周期末期才出現明顯故障風險,且峰值故障率僅為過去兩次觀測值的三分之一左右。
IT之家注意到,Doyle 和 Patterson 在文中寫道:“這不僅是硬盤壽命上的重大提升,更是我們首次觀察到故障峰值出現在‘曲線末端’—— 即接近使用壽命極限的位置。而且這個峰值大約只有之前兩次峰值的三分之一。”
今年分析所涉及的硬盤來自 HGST、Seagate、Toshiba 和 WDC 等制造商,容量范圍從 4TB 到 24TB 不等,平均使用年限介于 3.7 個月至 103.9 個月(約 8.7 年)之間。作為對比,2021 年樣本中的硬盤同樣來自上述廠商,平均使用年限為 3.57 至 80.85 個月(約 6.7 年),最大容量為 16TB。
長期以來,Backblaze 一直采用工程領域著名的“浴盆曲線”(bathtub curve)模型來評估硬盤故障行為。該理論認為,電子元件的故障率隨時間呈 U 型變化:初期因制造缺陷導致早期失效較多,隨后進入穩定低故障期,最終因老化而故障率再次上升。
然而,如 Backblaze 發布的圖表所示,其實際觀測結果并未完全符合傳統浴盆曲線。作者指出,在 2021 年及 2025 年的數據中,硬盤在整個生命周期的大部分時間內保持了相對穩定的低故障率,直到接近壽命終點時才出現明顯的故障激增。
博客進一步解釋道:“這意味著什么?簡而言之,硬盤正在變得越來越好,也越來越耐用。鑒于 2021 年至 2025 年間趨勢線形狀基本一致,我們預計未來幾年仍將持續這一模式。因此,等到 2029 年左右再回過頭來看,很可能會發現故障峰值進一步向后推移。”
在接受 Ars Technica 采訪時,Doyle 表示,Backblaze 的這項分析對消費者選購大容量硬盤具有積極意義:“這些設備比以往更持久了。”
她補充道:“從某種意義上說,數據中心對硬盤的使用可以被視為對其性能的終極考驗 —— 硬盤長期處于通電運行狀態,持續高速旋轉,并頻繁進行讀寫操作,其工作強度遠超普通消費者的日常使用場景。行業整體趨勢是硬盤單盤容量不斷增大,用戶所需購買的數量減少。因此,了解這些硬盤在嚴苛數據中心環境下的表現,能讓我們更有信心地判斷:無論你選擇哪款硬盤,都是一項值得的投資。”
此外,硬盤壽命的延長也為消費者提供了一個重要理由:在面對更快但價格更高的固態硬盤(SSD)時,仍可認真考慮繼續選用 HDD。
Doyle 強調:“有必要仔細評估延遲性能的提升是否真的物有所值。”她建議用戶根據自身需求權衡成本與性能,而非盲目追求新技術。
盡管觀測結果與經典理論存在差異,Doyle 和 Patterson 并不主張徹底拋棄“浴盆曲線”。他們并非否定該模型對 HDD 的適用性,而是強調其未能充分納入影響硬盤故障率的多種現實因素,包括工作負載強度、制造工藝差異、固件更新情況以及運維過程中的動態變化。