投稿

ラベル(ループ)が付いた投稿を表示しています

たまに掃除は必要!熱暴走…

イメージ
 そんなに暑くないのに… 本日、午前中にオンラインで打合せをしていると、突然マシンがダウン。 一瞬、停電か?と思ったもののディスプレイの電源は入っている。 あれっ?と思い、すぐさまノートで打合せを継続。 その間に、再度マシンの電源を投入。 問題なく起動する。 でも、CPU温度がたまたま目に入り、95℃を超えて徐々に上昇していく。 105℃あたりで再度マシンダウン。 これは、熱暴走によるダウンの可能性が高い。 以前、CPUをRyzen7→9にした頃は、60℃〜70℃程度だった記憶がある。 本当はGW中にSSDの載せ替えを行う予定だったけれど、忙しくて先延ばしにしていた。 その時やっていれば、多分掃除もしただろうに…。 ということで、午後からマシンを解体し、掃除をすることに。 ケース本体のFANはホコリがかなり溜まっている。 GPUのFANは問題ない。 電源とCPU FANはひどい。 一旦、CPU FANを取り外し、きれいにする。ついでにCPUグリスも塗り直しセット。 動作確認すると、投入直後で40℃台。 そりゃ、熱暴走も起こすわけだ。 せっかくバラしたので、SSDの載せ替えを実施。 OSは500GBで、ユーザ領域(/home)は1TBを使用しているもののAIのmodelをいくつも落としていたり、DockerのImageが多種置いてあるため、結構容量を食っている。 今回、2TBのSSD( Hanye SSD ¥17,800- で入手済)を用意してあるので、 1TB→2TB, 500GB→1TBと玉突きで移動させることを計画していたので実施する。 本当は、ddコマンドで移すつもりだったのだけれど、3月にお客さんのところで使いそうだったので、 ORICOのクローン機能付SSDアダプタ を入手済。 裸族のSSD版ですね…。1万円程度の品です。 これに、新品のSSDとこれまでの1TBのSSDを差し込んでクローン開始。 そこそこ時間はかかるものの、放置でOK。 ただ、HanyeのSSDについているヒートシンクが引っかかるため、一旦取り外してクローン後取り付ける必要があった。 続いて、500GB→先程の1TBに書き込み。 ただ、1TB(samsungの980pro)が、先程のクローンでかなり熱くなっていたため、速度低下が激しい感じ。1TB→2TBよりも時間がかかった感じ。 ...

Windows7 が再起動を繰り返す

イメージ
朝からトラブルの電話 ゆっくり起きて間もない7:30に、保守を受けている会社から電話が…。 朝来てみると、マシンが再起動を繰り返すという 状況を確認 一晩中起動しっぱなし、あるシステムの親機になっている Safeモード…通常起動…などの表示が出て、放置すると通常起動する 起動後すぐに再起動する→上の表示になり繰り返す というもの。 カーディーラーで専用の管理システムを使っているけれど、顧客情報や見積などは、この親機からのデータを元に、各クライアントが運用されているので起動しないと、仕事が出来ないという泣きの電話でした。 身支度を整えて、8時に現場入り。 実機確認 以前、WindowsXPだったマシンを、Windows7にリプレイスして、入っているソフトなどを全部移行したマシンなので、大体の構成も、アプリも把握している。 実際に見てみると、確かに起動直後に、勝手に再起動に入り、正常終了していないので、起動時にSafe Modeで起動するかどうかの確認メッセージが表示されている。 念の為、強制シャットダウンしてみるが、正常に起動した後、再起動に突入。 Safeモードで確認 イベントログを見ると、エラーを吐いているが、有用な情報はない 昨日の状況を聞くと、特段変更等は行っていない Windows Updateの更新記録を見ると、昨日(今朝早く)更新がかかっている。 多分、これだ…。 そこで、報告が上がっていないかググッてみる。 期間を1週間限定にする。 2018年3月 (2週目/月例更新) のWindows Update メモ (19時更新) 比較的新しい情報が上がっていた。一昨日の更新内容について書かれていた。 KB4088875 KB2952664 が、該当する。 どうも、再起動を繰り返すケースがあるらしい。 やっぱりか…。 更新記録のKB番号と一致している。 対策 Safeモードで起動して、上記2つの更新プログラムをアンインストールする。 再起動をかけると、正常に動作するようになった…。 再度、更新プログラムが適用されると、元の木阿弥なので、一時的に更新プログラムの自動適用...