* RAID の故障モデル [#h648297f]

「[[RAID の弱点>日記/2008-02-19/RAID の弱点]]」でかなりショッキングな計算ができてしまったので,調子に乗ってもう少し突っ込んでみたい.
が,MTBF をベースにした議論では私の頭では限界があるので,ここでは別の故障モデルを考えてみる.

おそらくこの様な議論は既に誰かがやっているのだろうが,文献には一切当たっていない.
というわけで,この議論の信憑性の判断については読者に任せることにする.

** RAID での問題点 [#sc0319b0]

「[[RAID の弱点>日記/2008-02-19/RAID の弱点]]」でも書いたように,RAID ボリュームの一部の領域しかアクセスが無い場合,縮退が発生したときには非アクセス領域に既に故障が発生していて再構築不能となる事態が発生する.

というわけで,今回はその確率について考えてみたいと思う.

** モデル [#se6c197b]

子ボリュームが4の RAID5 を考える.

   V1  V2  V3  V4
 ┌─┬─┬─┬─┐
 │A│B│C│D│アクセス領域    r
 ├─┼─┼─┼─┤
 │ │ │ │ │
 │E│F│G│H│非アクセス領域  1 - r
 │ │ │ │ │
 └─┴─┴─┴─┘

- 常日頃アクセスするのは全ボリュームに対して r の割合 ( 0 ≦ r ≦ 1 ) 
- 日頃はアクセスしない非アクセス領域の割合は 1 - r となる.
- 上図では A は ボリューム V1 でのアクセス領域,B はボリューム V2 で … H はボリューム V4 での非アクセス領域

故障のしかたであるが
- 記憶域の一部にアクセスできない,セクタエラーを考える
- 故障は全記憶領域に対し均等な確率で発生する
-- ある状態での発生確率は記憶領域量に比例することになる

故障の発生のしかたは
- 故障は1か所ずつ逐次的に発生する
-- 一度に数個発生はしない
- アクセス領域のアクセス間隔は,故障の発生間隔よりも十分短いこととする
-- つまり,アクセス領域 A, B, C, D のいずれかに1か所の故障が発生すると,その時点で縮退モードに移行する
-- A, B, C, D に故障が2ヶ所発生する場合は無い



トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS