投稿

ラベル(解決)が付いた投稿を表示しています

たまに掃除は必要!熱暴走…

イメージ
 そんなに暑くないのに… 本日、午前中にオンラインで打合せをしていると、突然マシンがダウン。 一瞬、停電か?と思ったもののディスプレイの電源は入っている。 あれっ?と思い、すぐさまノートで打合せを継続。 その間に、再度マシンの電源を投入。 問題なく起動する。 でも、CPU温度がたまたま目に入り、95℃を超えて徐々に上昇していく。 105℃あたりで再度マシンダウン。 これは、熱暴走によるダウンの可能性が高い。 以前、CPUをRyzen7→9にした頃は、60℃〜70℃程度だった記憶がある。 本当はGW中にSSDの載せ替えを行う予定だったけれど、忙しくて先延ばしにしていた。 その時やっていれば、多分掃除もしただろうに…。 ということで、午後からマシンを解体し、掃除をすることに。 ケース本体のFANはホコリがかなり溜まっている。 GPUのFANは問題ない。 電源とCPU FANはひどい。 一旦、CPU FANを取り外し、きれいにする。ついでにCPUグリスも塗り直しセット。 動作確認すると、投入直後で40℃台。 そりゃ、熱暴走も起こすわけだ。 せっかくバラしたので、SSDの載せ替えを実施。 OSは500GBで、ユーザ領域(/home)は1TBを使用しているもののAIのmodelをいくつも落としていたり、DockerのImageが多種置いてあるため、結構容量を食っている。 今回、2TBのSSD( Hanye SSD ¥17,800- で入手済)を用意してあるので、 1TB→2TB, 500GB→1TBと玉突きで移動させることを計画していたので実施する。 本当は、ddコマンドで移すつもりだったのだけれど、3月にお客さんのところで使いそうだったので、 ORICOのクローン機能付SSDアダプタ を入手済。 裸族のSSD版ですね…。1万円程度の品です。 これに、新品のSSDとこれまでの1TBのSSDを差し込んでクローン開始。 そこそこ時間はかかるものの、放置でOK。 ただ、HanyeのSSDについているヒートシンクが引っかかるため、一旦取り外してクローン後取り付ける必要があった。 続いて、500GB→先程の1TBに書き込み。 ただ、1TB(samsungの980pro)が、先程のクローンでかなり熱くなっていたため、速度低下が激しい感じ。1TB→2TBよりも時間がかかった感じ。 ...

MySQLで接続エラー

 MySQLコマンドを実行すると... これまで、普通に使えていた以下のコマンドが何故かエラーになるようになった。 Updateの影響だとは思うのだが…。 ``` $ mysql -p Enter password:  ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/tmp/mysql.sock' (2) ``` 原因が分からない。 一応、ERRORメッセージで検索すると、同様なエラー報告はあるものの、どれを試しても動作しない。 で、仕方なくコマンドが通るマシンと、エラーを吐くマシンで比較しながら追ってみた。 まず、/tmp/mysql.sock が無いというので、作成する方法は所有権を変えようが、Permissionを変えようが、結局はだめ。 作成して実行すると、pidファイルが怪しい。 /var/lib/mysql/マシン名.pid を生成するはずなのに、エラーが起きるマシンでは生成されていないことを突き止めた。 サービス起動のスクリプトの異常なのか? と思いつつも、GUIツールから接続すると正常にDBに繋がり、問題なく操作できる。 SSHでtunnelすれば接続できるし…。 解決方法を見つけた! そこで、mysqlコマンドのオプションを色々試して見ると…。 hostを指定すると動作することが判明 どうも、localhostが正常に解決できていない感じ…。 そこで、以下のように実行してみる $ mysql --host=127.0.0.1 -p すると、正常に動作することが判明! 毎回記述するのは手間なので、aliasを設定する。 .bashrc もしくは .bash_aliasesに以下のように記述。 alias mysql='mysql --host=127.0.0.1' これで、OK これまで通り、mysql -pと叩けば正常に動作する。 そのうち、スクリプトが修正されるかもしれないので、本体をいじるより安全に運用できるので良し! 苦戦している人は、試してみると良きです。