[知識/開箱] 如何挑選適合的 NAS 硬碟及 RAID 種類,硬碟科普與 RAID 架構大比較
硬碟?
硬碟是電腦上使用旋轉碟片為構造的「非揮發性儲存裝置」,電腦數位化的資料會通過硬碟離磁性表面很近的磁頭,由電磁流來改變極性方式被電磁流寫到磁碟上,並會在平整的磁性表面儲存和檢索數字資料,因此硬碟碟片的平整性就特為重要。
▲ 圖片 / Seagate
從電腦發展歷史以來,儲存資料的裝置一直是發展樹中重要的一環。從 1960 年代一開始使用磁帶作為儲存媒介到後來發展出新科技 – 現代硬碟始祖 IBM 305 RAMAC 僅有 5 MB(未格式化的容量) 的大小和 IBM 3340 60MB、1200 rpm 規格(現在硬碟的 6 倍慢);直到現今硬碟發展出一般碟、監控碟、企業碟等等不各種同用途的硬碟種類。
因為這篇包含太多知識和內容了,因此歡迎讀者挑選有興趣的段落前往:
文章段落
- 硬碟介紹
- NAS 是什麼?NAS 特性影響購買硬碟的選擇
- 開箱 – Seagate IronWolf 那嘶狼 NAS 專用硬碟
- 從「硬碟架構」挑選硬碟
- [MYTH #1] EXT4 比較快?EXT4 vs BTRFS 比較
- [MYTH #2] 硬體 RAID / 軟體 RAID 比較
- [MYTH #3] RAID 差異?實測各種 RAID 速度
此篇下集:[知識] 痛過才懂珍惜,硬碟壞過才懂得如何保護資料安全!
現代資料儲存需求越高,用途也越廣泛:雲端儲存、NAS
▲ 圖 / Synology 官網
近幾年來,雲端應用大眾化、資訊量的爆炸,出門在外人手一機並都能上網,有時突然想要取得一個工作用的資料,卻放在家中關機的電腦裡,是有點那麼不方便。有了這類的需求,加上隨時備份資料的用途,造就了雲端硬碟的應用 – NAS 個人雲端空間的興起。
對於一般剛入門的人來說,NAS 的選擇可以透過價格、品牌和用途來篩選,但 NAS 用的硬碟光是同一個品牌就有好幾種,各大品牌特性又不同,對於剛接觸的使用者來說可能就不那麼清楚了。那怎樣的硬碟適合 NAS 或者備份用的磁碟陣列呢?
NAS 是什麼?NAS 之特性影響購買硬碟的選擇
NAS、Network Attached Storage 網路連接儲存設備,或許一般較少接觸的使用者會不太清楚這是什麼用途的裝置。
簡單來說 NAS 就是一台安裝硬碟,專門做儲存用的一台小主機,它也是一台小電腦但又比起電腦省電,加上它搭載的連網功能及對應特定用途開發的專屬系統,就能達成隨處存取個人雲的特色,而 NAS 因為硬體設計也有幾個影響硬碟的因素:
- 24hr 開機 – 硬碟工作設計時數
NAS 在一般的使用狀況下,因為遠比電腦主機省電(電腦耗電大約 100~200 W 以上,NAS 則是 20~40 W 不等),加上 NAS 的任務往往是需要長時開機的(才能隨時存取,並進行下載、同步等任務)。因此 NAS 需求的硬碟最好是能有 7/24 小時的設計,且 MTBF(平均故障間隔)越高越好。
- 同時擁有多槽(bay)硬碟 – 硬碟震動感應設計
主流 NAS 通常會擁有 2 ~ 4 個以上的硬碟槽,甚至高階機種還有 8 Bay 以上。舉例來說,Synology DS218+ 標示 2 Bay ,這樣就是指擁它有兩個硬碟槽,每個分別可以插上 14 TB 的硬碟。因為 NAS 通常會講究資料的安全性或者追求硬碟的速度,因此在多槽設計之下可以做更多軟硬體邏輯陣列的應用(RAID)。
但在同時擁有多槽的主機之內,硬碟的部署及運作環境就更容易受到其他硬碟的干擾。加上硬碟磁軸旋轉運作時會震動,更容易引起「共振」影響其他顆硬碟,此時針對硬碟震動及干擾的硬體設計(如平衡馬達、RV 感應器等)在多 Bay 的機器中就特為重要,有如一些官方數據更是建議 NAS 採用的硬碟最好有專屬設計。
當然選擇你要使用了 NAS 之後,最主要的目標就是安裝硬碟進行資料儲存等使用,因此緊接著的步驟就是購買適合的硬碟安裝於 NAS。我在幾年前硬碟的挑選上主要以企業級及 MTBF 指數為主,即使還將陣列用的兩顆硬碟分開購買避免批號相同,但還是免不其難的被某牌黃標企業級 3TB 給雷了 QQ。後來也購入了 NAS 主機,但紅標負評太多,因此便想說可以嘗試看看 Seagate 的新產品線 – Ironwolf(目前用到現在兩年經驗是頭好壯壯(後續會補充))。
那我們就開箱 Seagate 推出的 IronWolf 那嘶狼硬碟當作範例,並透過它的設計介紹硬碟挑選上的一些小概念 ▼
開箱 – Seagate IronWolf 那嘶狼 NAS 專用硬碟
▼ Ironwolf 的包裝有別於幾年前 Seagate 平淡的版本,這系列以代表性的狼頭當作 Logo,整體變得很繽紛,這次開箱的那嘶狼主打系列上市後也獲得非常多的好評。
▼ 拆開包裝裡面是以防震盒 + 靜電袋密封硬碟,保護十分充足。要特別說的是這防震盒超級好用,無論是送修、單純儲存放置硬碟等都可以把這防震盒留下來擺放保護硬碟。
▼ 拿出我們今天的主角 Seagate IronWolf 那嘶狼 NAS 專用 4TB 硬碟,厚度大概是樂高人偶的身體高(2.4cm,3.5″ 硬碟大多為 2.61 CM)(不過這厚度應該是 NAS 碟盤的極限了,很好奇容量再大如 14TB 內部是怎樣設計的硬體架構)
▼ 背面也是硬碟的心臟:裝載著各種控制元件的主機板以及與主機相連的 SATA 3 連接器(理論速度 6 Gbps,傳統硬碟目前都吃不滿) ,而這塊小小的主機板上更是包含 RV 感應器、CPU(通常會與介面電路共構),馬達驅動電路(主軸馬達跟磁頭驅動馬達),快取記憶體等重要元件!
▼ 其實硬碟開箱沒有什麼特別重要的步驟,只需要拿出你的 NAS 硬碟托盤,安裝正確方向對應上正確位置的螺絲孔就可以了(圖為一般 NAS 硬碟托盤)
Ironwolf Pro
▼ 而 Ironwolf 那嘶狼家族除了一般版本外,另外還有個 Pro 版,在外觀上並無明顯差異
▼ 但從背後的主機板可以觀察出 Ironwolf Pro 的用量上更好,不僅主機板的大小更大,從細節地方可以看到 Pro 版本還帶有散熱貼片(接觸金屬外殼助於散熱)
▼ 但 Pro 及一般版本在厚度上都控制的很好沒有差異
▼ 實際重量出乎意料的竟然不一樣,Ironwolf Pro 重了大約 80g,應該是主機板大了一些的關係加上不同零件增加的些許重量
從「硬碟硬體設計」挑選硬碟
那我們剛剛介紹的兩顆硬碟在硬體上有什麼差異呢?挑選硬碟大概可以從這「四個規格」來選擇:
▲ Hard disk drives (Wiki)
1. 主軸馬達的轉速
硬碟的硬體架構中是以固定磁頭構造及旋轉碟片(固定在主軸馬達)去讀取搜尋並寫入數位資料的(見下圖),因此資料讀取及寫入的速度就直接與碟片本身主軸馬達的轉速架構呈現正相關(當然也會因為磁頭驅動臂影響)。每分鐘的碟片旋轉速度越高(單位為 RPM),代表硬碟的速度更快(MB/s),在 50 多年前 IBM 最初代硬碟始祖的巨型硬碟每分鐘轉速(RPM)僅有 1200 次,直到現今,硬碟 HDD 體積越來越小,轉速也來到普及化的 5400 RPM 及 7200 RPM 的速度(企業級甚至有萬轉、15000 RPM 的版本,雖然物理限制上還是不及純電操作的 SSD)
因此,在評估硬碟的預期速度效能,或比較不同的硬碟規格時,主軸馬達的轉速規格是相當重要的。一般情況下,硬碟外觀貼紙或銘牌都會有標註規格,或者上官網查詢也會提供
▲ 圖片 / Seagate-Ironwolf
1-2. 轉速差異影響
舉個最實際的例子來顯現:Ironwolf 4T 及 Ironwolf Pro 4T 在磁片密度上相同,但轉速上就有 5400 rpm vs. 7200 rpm 的差異(Ironwolf 6T 以上均為 7200 rpm),那實際使用上有沒有差別呢?
測試設備:
- MBPR 2018 15″ Core i9 via Thunderbolt 3
- AKiTiO Thunder 3 雷霆戰艦 3 – SPAN 模式
- Ironwolf 4T * 1 & Ironwolf Pro 4T * 1
- 測試次數:每顆 3 次
▼ 以同一個環境下分別進行三次測試 Ironwolf 及 Ironwolf Pro 兩個版本硬碟的實際寫入及讀取速度大約差了 30 MB/s 15% 左右;IronWolf Pro 採用 7200 RPM 馬達轉速提供 210MB/s 以上的循序傳輸效能,即使磁片密度相同,轉速不同帶來的速度還是會有明顯差異。雖然在現今 SSD 當道的時代這幾十 MB 可能微不足道,但 7200 RPM 能有 220 MB/s 的表現搭配上適合的 RAID 模式是個具安全性又不錯的選擇
2. RV感應器 / 雙平衡馬達
如果你是一般家用電腦選擇硬碟,那或許比較不需要注意這一項。
我們在之前也提到,多硬碟並存同時運作的環境容易因為震動干擾其他硬碟的讀寫頭在寫入時造成碟片刮傷損毀,進而造成壞軌。因此如果你打算組陣列、NAS 等等多硬碟同時運作的需求(Seagate 官方文件建議磁碟機數量如果超過 5 部),建議為系統加裝 RV 感應器(不過我自己是 2 顆就選擇內建 RV 感應器的硬碟了啦)
而針對這種 NAS 多硬碟運用的環境,Ironwolf 系列搭載了 AgileArray 技術,在硬碟碟片的轉軸兩端加入固定的雙平衡馬達和 RV 旋轉震動感應器加強讀寫頭在遇到微小震動時修正的能力;雖然硬碟造成的旋轉震動因為物理元素無法避免,但當硬碟遭受震動時,會透過雙平衡馬得將震動的力道分散到機殼,RV Sensor 則會根據震動幅度所產生的位移量調整硬碟內的讀取頭與碟片的間隙,預先補償減少讀取頭損害硬碟碟片的風險,將其影響降至最低,使 Ironwolf 系列適合安裝在多 bay 的 NAS 當中。
*註:Ironwolf 系列要 4TB 以上才搭載此技術!!!我之前買了 2TB 才知道 orz
▼ Ironwolf 電路板正面,有搭載 2 顆 RV 旋轉震動感測器,而雙平衡馬達則是在碟片中軸
3. 溫度
另一個影響硬碟壽命及工作狀態的就是溫度了,有一套好的系統能隨時監控硬碟工作時的溫度特為重要,特別是當你硬碟組 RAID 陣列數量一堆,造成的廢熱影響硬碟速度及長期下來的壽命則不太好。因此在硬碟的挑選上特為要注意溫度的表現,但這種數據還是要實際測試才知道,因此只能透過爬文來在購買前瞭解。
▼ 實際測試 Ironwolf Pro 運作時溫度大約 32 度左右,算是我用過的硬碟中偏中低的機種(我之前某很可怕的 3T 系列(就是你想的那個)的企業級硬碟大概 40 ~ 45 度以上…)。另外除了透過 S.M.A.R.T 資訊來觀察硬碟外,Ironwolf 系列還能搭配 NAS (Synology、QNAP、ASUSTOR)提供 IHM 的環境預測監控機制。
4. MTBF
硬碟在設計上其實還有個耐用度的問題。NAS 專用硬碟如 Ironwolf 都是設計以 24X7 連續七天 24 小時不間斷運作來設計使用的,而因此在 MTBF(平均失效間隔時間)的數據上會高於一般家用產品(企業級硬碟更強調這個數據)。
MTBF(平均失效間隔時間)從字面上來看就是給你一個多久硬碟會炸裂的參考數據,大多產品為幾十萬的數值起跳,而企業級產品甚至會達到 120 ~ 200 萬小時的數據。但 120 萬小時換算大約 137 年,不太可能是這個時間(你都沒活那麼久了)。因此 MTBF 其實是透過該硬碟產品本身大量實測(一次大批測試)統計出來的年失效率(AFR)搭配時間換算出來的一個統計數值依據。因此,將 MTBF 及 AFR 當作一個「損壞機率」的參考依據來相比就好,畢竟硬碟長時間運作下來損換機率還是有的,並且最終還是取決於人品的…,對於資料安全及硬碟救援有興趣的人,敬請期待這系列的下集!
此外除了依照瞭解 MTBF 數據 ,硬碟的耐用度也可以參考 Backblaze 之類的報告來當作另一個參考依據!(每季均會提供市面硬碟報告,但 Backblaze 是將硬碟安裝在 365 天 7/24 全年無休的資料中心中使用,還是需要依照實際使用情況而定)
▼ 因此,在硬碟挑選上,如果你需要組多槽磁碟陣列,那選擇有 RV Sensor 的系列硬碟會更好,或者就是選擇 MTF 高設計 24/7 全時使用的企業級硬碟也是個方向。但如果是一般家用電腦,反而考慮保固及售後服務的部分會更佳。
選好了硬碟,再來呢?
在你安裝完硬碟之後,會歷經硬碟格式化,選擇硬碟磁區的格式,RAID 模式的挑選與使用等等的情境。而在網路上在這些情況下有蠻多使用迷思的。有如 NAS 磁區上 Ext4 和 Btrfs 究竟要選擇哪種,或者哪種 RAID 模式最快最好,甚至有些人會拿這些架構上的因素來當作攻擊不喜歡的 NAS 廠商的論點… 今天就帶大家做一些實測來破除 Myth !
[MYTH #1] EXT4 比較快?EXT4 vs BTRFS 比較
EXT4 和 BTRFS 是 Linux 系統常用的兩大磁碟格式,在你安裝完硬碟需要格式化時,便會出現這兩個選項。當然因為主流 NAS (Synology、QNAP)是以 Linux kernal based 去打造旗下的系統的,因此在兩家的 NAS 上也是以這兩種格式為主。但 EXT4 和 BTRFS 各有其優缺點:EXT4 發展較久,很穩定;BTRFS 因為是個較新的格式,支援一些好用的功能如快照等。
因此為了測試這兩種格式間的效能差異,我們選擇了兩顆 Ironwolf 硬碟,並在 Synology NAS 上模擬最一般使用的狀況來測試:
測試設備:
- Synology DS1517+ 搭配 Intel x540 10 GbE 網卡(10 Gbps / 1250 MB/s 避免頻寬不足沒有真正測試出硬碟效能)
- Ironwolf 4T * 2 顆(HDD1、HDD2)比較差異
- 僅 SPAN 磁區
▼ 從結果來看在 SeqQ32T1 EXT4 的讀取速度有如網路上的傳言海放 BTRFS,但在寫入或者連續讀取、4K 等一般常見用途的情況下其實兩者相當,選擇哪種來使用我覺得依照用途見仁見智。
當然 EXT4 和 BTRFS 對於一般沒有在用 Linux 或者 macOS 等使用者來說有點太遙遠,我另外做了個更平易近人的 APFS、HFS+、NTFS 等 windos & macOS 常用格式間的比較:
測試設備:
- AKiTiO Thunderbolt 3 雷霆雙劍 3
- MBPR 2018 15″ via Thunderbolt 3
- Ironwolf 4T * 2 組硬體陣列 RAID 0(來獲取最大速度方便測試差異)
- 測試次數:每組採樣 3 次取平均
▼ 出乎意料的是 APFS 這個去年 Apple 才推出的新格式在表現上與我們用了 10 多年的 HFS+ 格式旗鼓相當(畢竟 APFS 一開始是針對 SSD 來設計與優化的)。而 FAT 系列如 EXFAT、FAT 32 雖然讀取表現不錯,但在寫入部分降速的十分嚴重,沒有發揮出 RAID 0 的優勢。另外跌破眼鏡的組合就是 NTFS ,或許是因為 NTFS 需要搭配驅動才能在 macOS 中運作,隔了一層驅動在高速疊加表現上就沒有那麼佳(同樣有測試過單顆硬碟,NTFS 與 HFS+ 和 APFS 間就沒有顯著差異)
[MYTH #2] 硬體 RAID / 軟體 RAID 比較
在開始建立 RAID 前,有些人或許也會有個迷思,硬體 RAID 是不是比較快比較穩?
▼ 舉個實際的產品例子,磁碟陣列專業廠商 AKiTiO 旗下的 Thunderbolt 3 陣列產品有 2 Bay 和 4 Bay 兩種型號,但其實目前 4 Bay 的陣列並沒有硬體陣列的規格,因此如果是這兩個裝置就會需要以不同的方法來製作 RAID
而從 AKiTiO 的說明頁 我們也可以更瞭解這兩種軟硬體 RAID 之間的介紹:
硬體 Raid :是由一個內置的 RAID 控制器所創建,並獨立於電腦和操作系統。硬體 RAID 會連接到一個 SCSI 控制器並且以一個單一的 SCSI 磁碟機代表 RAID 陣列的裝置。這意謂者您可以將產品使用在不同的電腦上,不會受限於作業系統,僅需注意該系統是否可以判讀您硬碟的格式 (例如:NTFS 或 HFS+)。
軟體 Raid :是由電腦的操作系統,或是具有操作系統的產品本身(如 MyCloud 系列)所創建的。軟體 RAID 是在核心磁碟(區塊裝置)程式碼上實作這許多種的 RAID 模式,它能提供最經濟的解決方案,因為並不需要昂貴的磁碟控制器或熱插拔的底盤。但會受限於系統版本的限制,您只能在初始創建磁碟陣列的操作系統版本上使用,例如:在 macOS 建立的磁碟陣列,無法在 Windows OS上使用。
簡單來說,RAID 的組成也是可以透過硬體裝置 RAID 控制器去將資料寫入的部分依照 RAID 模式去分配下去,但你同樣也可以節省成本的使用電腦的作業系統來製作 RAID,但就會被綁定在該作業系統上並吃 CPU 的資源,甚至大版本更新還會有相容性問題。
那從如此一來,如果考慮到你系統常發佈更新以及相對長久的穩定性的話,硬體 RAID 會較為優勢;在速度上是否會因為軟體模擬而不如硬體 RAID 的速度呢?
測試設備:
- AKiTiO Thunderbolt 3 雷霆雙劍 3
- MacBookPro Retina 2018 15″ via Thunderbolt 3 macOS 10.14
- 硬體陣列:AKiTiO 原生 RAID 0 模式
- 軟體陣列:SPAN 模式並透過 macOS 10.14 磁碟工具程式製作 RAID 0
- Ironwolf 4T * 2 組陣列 RAID 0(來獲取最大速度方便測試差異)
- 測試次數:每組採樣 3 次取平均
▼ 從結果來看軟硬體陣列間在 HFS+ 和 APFS 兩組測試下軟硬體之間的差異其實不明顯,表現旗鼓相當,代表現在的 CPU 搭配軟體陣列的支援是可以與硬體陣列做到一樣的表現的。
反而是與我們預期相反:硬體陣列的寫入都比軟體陣列模式低了一些,但還在合理可接受的範圍(HFS+/軟體)。也另外彰顯了 Apple 在軟體 RAID 上對 HFS+ 的維護成效有佳,表現在四組測試中最好,整個出乎意料(也有可能是因為我用 Core i9 測試的關係…)
[MYTH #3] RAID 差異?實測各種 RAID 速度
容錯式磁碟陣列(RAID, Redundant Array of Independent Disks),舊稱容錯式廉價磁碟陣列(Redundant Array of Inexpensive Disks),簡稱磁碟陣列。其基本思想就是把多個相對便宜的硬碟組合起來,成為一個硬碟陣列組,使效能達到甚至超過一個價格昂貴、容量巨大的硬碟
▲ Source:Wiki
RAID 技術主要包含 RAID 0~RAID 7 等數個模式,它們的目標重點各不相同,如果想要瞭解 RAID 模式詳細實作方法的歡迎參考 Wiki,而常見的 RAID 形式以用途來說有以下幾種:
- Raid 0 – 此模式是想要擁有效能、速度的最佳選擇。
- Raid 1 – 此模式是想要擁有資料安全的最佳選擇。
- Raid 5 – 此模式是想要同時擁有效能與資料安全的選擇。(相對危險)
- Raid 6 or 10 – 此模式是想要同時擁有效能與資料安全的最佳選擇。
測試設備:
- Synology DS1618+ 搭配 Intel x540 10 GbE 網卡(這次用 DS1618+ 不怕 CPU 不夠力!)
- Win 10 with Intel x540 10 GbE 網卡(iPerf3 最佳表現可以到 8 Gbps)
- Ironwolf 4T * 4 依照不同 RAID 陣列模式選擇數量(事先挑選過體質較好的兩顆)
- 測試軟體及次數:EXT4 搭配 SMB 掛載以 CrystalDiskMark 5.2.2 x64 測試,每組 5 次取平均
*註:同樣有以 IOMETER、dd 指令測試,但會因為 RAID 快取及控制器等外在因素影響結果因此不採計
結果:
*註,在容量上是這樣分布的:
- SINGLE:單顆硬碟做為 baseline(4T)
- RAID 1(4T)
- RAID 0、RAID 10(8T)
- RAID 5(12TB)
從結果來看,有蠻多有趣又特殊的地方:
- 在寫入/讀取速度上的表現,RAID 5 果不其然表現最好(畢竟用了四顆硬碟),更令人訝異的是寫入表現猶佳(但還是有卡 bound 沒有將四顆硬碟 200 MB/s * 4 的結果表現出來)。然而 RAID 5 的容錯機制以及 rebuild 失敗問題一直為人詬病,加上「硬體有價,資料無價」,因此雖然 RAID 5 很快又有容量優勢,但相對來說可以犧牲一點容量,或者多購買硬碟去考慮 RAID 10 或 RAID 6 會更好
- RAID 1 的寫入與單顆硬碟相當(畢竟寫入的兩顆目標硬碟是採取同步備份機制),RAID 10 的讀取也與單顆硬碟的讀取相當,或許速度是卡在「先鏡射再分割的過程」蠻疑惑的結果。
- 觀察 RAID 0 的結果可以知道其實透過兩顆傳統機械硬碟就可以達到接近 SSD 的速度了,因此如果對於速度有苛求的人可以考慮買海量的硬碟來組 RAID 0(不怕資料消失的話XD)
- 對於一般 NAS 使用,RAID 10、RAID 6 的速度表現其實就蠻夠用的,加上備份機制健全,還是推薦大家挑選這兩個模式
4 顆高級硬碟組 RAID 能達到最快的速度才與一顆 SATA 3 SSD 的速度相當 XD,但考量到資料的備份及安全性,採用多硬碟組 RAID 陣列是非常值得的,加上 SSD 在損壞後資料還原的部分非常困難,傳統硬碟在這部分還是有大優勢(關於硬碟救援部分可以參考這篇的下集:[知識] 痛過才懂珍惜,硬碟壞過才懂得如何保護資料安全!)現今一般使用的電腦系統碟因為速度大多還是選擇以 SSD 為主,但傳統硬碟在容量上還是較具優勢,有如 NAS、冷儲存、陣列等大多會優先考慮傳統硬碟,因此從個人用途與需求來對應到硬碟廠牌提供的對應機制與售後服務來挑選硬碟是個不錯的出發方向。
比較完這些,還是有一些如:1. 硬碟大小和碟片數量會不會影響速度及耐用度 2. 高容量的 RAID 陣列穩定性,等等硬碟選擇上的迷思會想要瞭解,待未來有機會也會測試給大家參考。
當然本篇的實驗數據會因為硬體、環境、硬碟體質等等因素和實際有所不同,盡量都先暖機、排除個體值差異、多次/長時間測試取平均來排除一些外在因素的條件(測試超久 orz);但選擇硬碟購買前還是請各位參閱公開規格說明書,這篇的資訊可以輔助大家在選擇硬碟上做個不錯的參考,選擇最適合自己設備及需求的硬碟!
本篇文章特別感謝 Seagate 協助測試!