システムの信頼性に関係する用語について纏めています。
■RASIS
信頼性に関連する5つの要素の頭文字です。
それぞれの頭文字は以下の通りです。
① Reliability、信頼性
② Availability 可用性
③ Serviceability 保守性
④ Integrity 完全性
⑤ Security 安全性
全くの余談ですが、私は日本語で「しんかほかんあん(信可保完安)」と覚えています。。。
※どうにも英単語が覚えられない。。。
■① Reliability、信頼性
平均故障間隔(MTBF)が数値化する際に用いられます。
MTBFが大きいほど、故障しにくいことを意味します。
MTBF=1/λ(λは故障率) ※λはラムダ
MTBFは動き続けている時間のことです。
■② Availability 可用性
稼働率が数値化する際に用いられます。
稼働率=MTBF/(MTBF+MTTR)
※MTTRは「平均復旧時間」もしくは「平均修理時間」のことです。直るまでの時間(=修理時間)のことです。下記③で出てきます。
■③ Serviceability 保守性
平均修理時間(MTTR)が数値化する際に用いられます。
MTTRが小さいほど、修理時間が短く早く直るということです。
MTTR=1/μ(μは修理率)※μはミュー
■④ Integrity 完全性
「データが完全である」ことの度合いです。
データは、改ざんされたり、不整合が発生したり、消失したりする可能性があります。
■⑤ Security 安全性
ウイルス被害や自然災害によるシステム停止など、システムがどの程度脅かされているかを示す指標です。
■フォールトトレランス(耐障害性)
システムに何かしらの障害が発生した際でも、
"正常に機能し続ける"ことを意味する単語です。
"正常に機能し続ける"という言葉の中には、
① 通常通り動き続ける
② 通常よりは性能が悪化するけど、何とか動いている
という2つの状態があります。
フォールトトレランスの具体的な手段(=設計思想)は以下の通りです。
・フェールセーフ
・フェールソフト
・フールプルーフ
・フェールオーバ/フェールバック
どの用語も、「故障/障害時に初めて有効になる設計思想」という意味を持っています。
注意点ですが、決して「故障/障害を発生させない」という設計思想ではないです。
■フェールセーフ
システムが障害等で故障した際や予期せぬ状況になった際でも、
安全動作する設計思想のことです。
「壊れたけど大丈夫だった」ってやつです。
例えばですが、日常だと以下のようなものがあります。
・震度5以上の地震の際に勝手に止まるガス/給湯器
・車の自動(補助)ブレーキ
■フェールソフト
俗にいう「縮退運転」の設計思想です。
RAID5のディスクが1本壊れた場合でも、安全に稼働し続けるような状態もフェールソフトの一つです。
「壊れたけど、何とか動いている」ってやつです。
■フールプルーフ
人為的なミスが発生した場合でも安全に稼働もしくは停止することを考慮した設計思想です。
車の急発進抑止機能とかが一例です。
■フェールオーバ/フェールバック
俗にいう、「稼働系/待機系」、「アクティブ/スタンバイ」「マスター/スレーブ」です。
冗長構成にしておくことで、稼働系故障時に待機系に切り替わる設計思想のことをフェールオーバと言います。
稼働系が修理済みとなり、処理系統を稼働系に戻す動作/設計思想をフェールバックと言います。
以上です。