ハードウェアのメンテナンス

つい最近ですが、私が使っているMacBook ProのHDDにエラーが発生し、起動はするもののあちこちデータやアプリが飛んでおかしくなってしまいました。

しょうがないのでOSを再インストールして、データを復旧。

バックアップしてあった事と、今時はメールに大事なものは殆ど乗っているので、外部メールを使っていれば何らデータの消失は起こらないんですよね。



で、同じような事がおちゃのこネットのサーバーにも発生しましたので緊急で機材の交換を行いました。



大体PC/サーバーの故障発生箇所は、



 ・HDD

 ・電源

 ・マザーボード



の三つに集約されます。

恐らく一番多いのがHDDの異常。

これも完全にクラッシュする事から、今回のように一部にセクターエラーが発生する程度まで症状も様々。

全てのHDDは二重化してあり、データもかなりの頻度でバックアップを取ってあるのでデータの消失までは考えにくい体制をお取りしていますが、起動しない重度の場合は一定の時間サービスに影響が出てしまいます。

SSDの導入も検討していますが、まだ費用対効果が悪いですね。



意外と多いのが電源の故障。

これはその筐体が起動しなくなるので、影響は大きい。

最近はなるべく電源も二重化されている筐体を使うようにしていますが、これも完全ではありません。



マザーボードやメモリーの故障となるとかなり確率は下がります。

過去の運用では殆ど経験がありません。



クラウドとか他所のリソースを使うことが流行っていますが、個人的にはそこまで外部に大事なリソースを依存して良いものか信用できません。

相当枯れた状態になって初めて検討すると思います。



コンピュータは必ず壊れるもの。

今後もメンテナンスと、障害時のサービスへの影響を最小限に止めるよう運営して参ります。