たまに掃除は必要!熱暴走…

イメージ
 そんなに暑くないのに… 本日、午前中にオンラインで打合せをしていると、突然マシンがダウン。 一瞬、停電か?と思ったもののディスプレイの電源は入っている。 あれっ?と思い、すぐさまノートで打合せを継続。 その間に、再度マシンの電源を投入。 問題なく起動する。 でも、CPU温度がたまたま目に入り、95℃を超えて徐々に上昇していく。 105℃あたりで再度マシンダウン。 これは、熱暴走によるダウンの可能性が高い。 以前、CPUをRyzen7→9にした頃は、60℃〜70℃程度だった記憶がある。 本当はGW中にSSDの載せ替えを行う予定だったけれど、忙しくて先延ばしにしていた。 その時やっていれば、多分掃除もしただろうに…。 ということで、午後からマシンを解体し、掃除をすることに。 ケース本体のFANはホコリがかなり溜まっている。 GPUのFANは問題ない。 電源とCPU FANはひどい。 一旦、CPU FANを取り外し、きれいにする。ついでにCPUグリスも塗り直しセット。 動作確認すると、投入直後で40℃台。 そりゃ、熱暴走も起こすわけだ。 せっかくバラしたので、SSDの載せ替えを実施。 OSは500GBで、ユーザ領域(/home)は1TBを使用しているもののAIのmodelをいくつも落としていたり、DockerのImageが多種置いてあるため、結構容量を食っている。 今回、2TBのSSD( Hanye SSD ¥17,800- で入手済)を用意してあるので、 1TB→2TB, 500GB→1TBと玉突きで移動させることを計画していたので実施する。 本当は、ddコマンドで移すつもりだったのだけれど、3月にお客さんのところで使いそうだったので、 ORICOのクローン機能付SSDアダプタ を入手済。 裸族のSSD版ですね…。1万円程度の品です。 これに、新品のSSDとこれまでの1TBのSSDを差し込んでクローン開始。 そこそこ時間はかかるものの、放置でOK。 ただ、HanyeのSSDについているヒートシンクが引っかかるため、一旦取り外してクローン後取り付ける必要があった。 続いて、500GB→先程の1TBに書き込み。 ただ、1TB(samsungの980pro)が、先程のクローンでかなり熱くなっていたため、速度低下が激しい感じ。1TB→2TBよりも時間がかかった感じ。 ...

ファーストサーバ障害に思う

IT関連ニュースを騒がす

20日に起きた、ファーストサーバの障害だが、利用していたユーザはとても面倒な状況に陥っている。しかも大手ときている…。
5万以上の顧客を抱え、うち8割が法人・官公庁関連というファーストサーバの大規模障害は、依然として被害の全容がつかめないままでいる。http://www.nikkei.com/article/DGXNASFK2600L_W2A620C1000000/
 よく考えてみると、ユーザ数が多いからとか、法人・官公庁が8割とかいう一般の人が多分基準にするだろうという文言を説明に使う事が、如何に意味がないかという事を、証明してしまっている。
しかも内容を良く読むと、バックアップというよりはレプリケート(複製)しか取っていないんじゃないかと感じる。障害時の復旧に切り替えるための冗長システムであって、バックアップではないと思うだけど…。そうか、バックアップシステムを省略してるのか…

まあ、詳しい解説やら状況は、おいおい出てくるとは思うけど、利用していた企業の担当者も慌てますわね。多少は…。

ところで何が問題か?

まぁサーバがこけるなんて事は、別段珍しくもないし、ハードディスクがお亡くなりになる事も時々遭遇する訳で。システム管理者ってそのためにバックアップなり作業なりしていると思うんだよね…。
会社のWebを管理していれば、当然クライアントにコピーが存在しているのが普通だとは思うから、それを新たなサーバにコピーして復旧完了。これが本来の流れ。だから、大多数の法人は、面倒ではあるけれど、それほど慌てふためく内容とは思えない。
ただ、ここ最近、wikiをはじめとしてCMSが流行しているので、サーバ上で生成したデータをちゃんとバックアップしているかとなると、やや疑問なんだと思う。この点が、慌てる原因にもなっているはず。

個人でもwikiって便利だから利用するけれど、別メディアにバックアップ取るのは案外面倒だから放置しているというのも理解できる。ましてやブログのデータを定期的にバックアップしてるか?と問われると、「してません」となってしまう。
ただし、個人であれば…です。趣味の範疇ですから…。
給料貰って、仕事として作業していたら、それは、やっぱり問題な訳で。いま、この事件をきっかけに慌てているSEさんたちも、きっといるんだろうな〜。
HDDやDVD,Blue-rayのメディアなんかが大量に売れるのかなぁと、下衆な勘ぐりをしてしまう。風が吹けば桶屋がです…。

どう対処するか

これまで、ちゃんとバックアップを取っていないのであれば、これをきっかけに、しっかり取る事です。特に大事なデータは。
数年前に自宅のPCのHDDが逝った時に、専門の業者に依頼したけれど、復旧できなかった。当時の子どもの写真が1年分くらい消失してしまった経験があるので、それ以来バックアップは欠かさず取っている。

今は、iMacに1.5TBの外付HDDを取り付けて、Time Machineで勝手にやってくれる設定にしてある。おかげで操作ミスで削除してしまったり、上書きしてしまった場合にも元のファイルが取り出せて、効率もアップしてるんだけど…。OS自体が暴走なりしてバックアップデータも壊されたりする危険性もあるわけで、これだけで安心とは言えないよね。

といって、テープなんていまさら使いたくない。クラウドにコピーを持つのは、セキュリティ的にもやや不安もあって、悩ましい所。でも近いうちに大量のクラウドスペースが安価になって(すでにかなり安いけど)そこで多重化するとは思うので、計画を立てるのが良策かなぁ。

と、ちょっとしたニュースを知って思った訳でした。


コメント

このブログの人気の投稿

Ubuntu24.04 でGUIが死んだ

VirtualBoxが異常

MEGAにも弱点があった?