fc2ブログ

『システムはなぜダウンするのか』:雨読夜話

ここでは、「『システムはなぜダウンするのか』」 に関する記事を紹介しています。

システムはなぜダウンするのか 知っておきたいシステム障害、信頼性の基礎知識
システムはなぜダウンするのか 知っておきたいシステム障害、信頼性の基礎知識
日経コンピュータ
日経BP社 2009-01-15

Amazonで詳しく見る
by G-Tools

関連商品
システム開発ジャーナル Vol.8
システムアーキテクチャ構築の原理 ITアーキテクトが持つべき3つの思考 (IT Architects’Archive ソフトウェア開発の実践)
上流工程で成功する人、つまずく人 (技評SE新書)
プロマネ失敗学 あなたを成功に導く14事例の教訓
IT業界のための『工事進行基準』完全ガイド 基礎と事例と18の特効薬


システムのダウンについて、多くの事例や技術などを挙げ、ダウンのメカニズムについて解説している本。
成功はたまたまの要素もあるが、失敗の場合は必ず原因があり、有益なので読んでみた。

システムダウンといってもその原因や経過は様々であり、本書では大きく以下の4種類に分けてそれぞれ論じており、こうした経験のある人からすれば思い当たることばかりではないかと思う。
  1. ソフト不具合(アプリケーション/OSやミドルウェア)
  2. 性能・容量不足
  3. 設定・操作ミス(設定・変更ミス/運用・操作ミス)
  4. 不慮の事故
これらについて日付問題やパラメータ設定漏れ、ハードの性能が上がったために枯れたシステムのバグが露呈したなど、これでもかというくらいトラブルの事例が分かりやすく書かれており、システムにはいかに多くのリスクが隠れているかが感じられる。

特に、トラブル時の対応や普段やらない運用などで二次災害が発生しやすいこと、そしてシステムそのものだけでなく作業者が端末を操作できなくなる場合など見落としがちなケースがけっこうあることに改めて驚かされる。

システム構成やトラブルに対する対策など、大まかな技術的なところにも触れられており、冗長化や待機系のシステムなど、なぜこのような形でシステムが構築されているのかも分かるようになってもいて、ためになることが多い。

システムダウンを完全になくすのは無理で、起こったときに被害を最小限に抑える仕組みづくりや事例に学ぶ工夫、できるだけ広い範囲でのテストの必要性などについて重視しており、かなり現実的な主張がなされている。

ダウンはいいことではないが、信頼性を高める機会や担当者が学ぶ場という一面があることや、単にダウンを悪と決め付けるだけではなく、ダウンをなくすにはそれなりにコストがかかるということを認識すべきことなどが書かれており、マスコミのシステムダウンに関する報道でありがちな精神論だけになっていないので説得力がある。

手に取った時に感じた以上に読み応えのある内容で、システムについての初心者だけでなく運用管理や開発に当たるベテランにも役に立つものとなっている。

この本はシリーズで他にも何冊かあるので、それらもそのうちに読んでみようと思う。





にほんブログ村 本ブログへ
スポンサーサイト




この記事へのコメント
washbookさん

コメントありがとうございます。

システムがダウンすることはどうやっても起こる時は起こると思うので、発生しないような対策はもちろん、復旧策もまた重要と思います。
これからも続く永遠の課題で難しいですが、技術を進歩させる動機付けでもありますね。
2009/03/07(土) 20:07 | URL | ufit #-[ 編集]
最近はシステムの障害が企業に与えるインパクトが非常に多いので、気になる書籍ですね^^;

業務の根幹にあるシステムは動いて当たり前という意識が誰しもあるので、事例などから原因を抑えて、先手を打つということが非常に重要になってきますね・・
2009/03/07(土) 07:58 | URL | washbook #-[ 編集]
コメントを投稿する
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 
この記事のトラックバックURL
この記事へのトラックバック
システムはなぜダウンするのか 知っておきたいシステム障害、信頼性の基礎知識(2009/01/15)大和田 尚孝商品詳細を見る ■感想 システムのダウン...
2009/04/13(月) | hobo-sickboy-