Proxmoxでサーバ構築

イメージ
これまでテスト用にi5第8世代の廃棄PCを使用してきた。 とはいえ今の所何も問題は起きていないが、入れ替えも視野に入れ予備サーバを用意することに。 - メモリ:16GB - SSD:500GB - DDNS+Let's Encrypt - Ubuntu24.04 この環境なので、すぐに構築し直すことは可能だが、とりあえずこのまま置いておいて別のサーバを立てることにする。 最初はRaspberryPiで構築しようと思ったけれど、本体電源+外付けHDD電源+ディスプレイ電源と考えると、邪魔なので廃案。 そこで廃棄しようと思っていた「Lavie NS300/N」が手元にあったので、これを利用することに。 一応バッテリーは正常に動作するので、UPS代わりにそのまま。 - Core™ i3-8145U(やや非力) - メモリ:8GB(少ないが…) - HDD:1TB なので、これまで使用しているものより、若干スペックダウン。 ただ用途は、非常勤で教えに行っている専門学校生用の練習マシンとする予定なので、まぁ問題なさそう。 Proxmox導入 直接、Linuxを導入してもよいのだけれど、今回は Proxmox を導入し、その上でUbuntu Serverを動作させる計画。 USBにProxmoxのイメージを焼いて、インストールすれば問題なく完了。 ただ、現在のバージョンはdebian - trixieがベースになっているので、若干参考になるサイトが少なめ。とはいえ旧版のは参考になるので調べつつ… HDDなだけあって、最初の起動は少し遅いものの、立ち上がってしまえば問題ない。 さぁ、VMにするかCTにするか…。 GUI使うのであれば、VMかなぁ。サーバだしCTでいいかぁ。 という程度の選定で、CT(コンテナ)で進めることに。 - メモリ:4GB - CPU:2 - HDD:20GB(root disk) - HDD:400GB(home用) - Ubuntu24.04 という構成で進めることにした。 テンプレートを用意して、初期設定を行い起動。 まぁすんなりと入った。 液晶を閉じたら、Suspendになってしまったので、若干設定変更。 $ sudo nano /etc/systemd/logind.conf HandleLidSwitch=ignore $ sudo sy...

デスクトップ機はサーバ機ではないのだよ

PCの不調調査

「突然マシンの電源が落ちるようになった」との連絡を受けて、調査に。
先週くらいから、使用してログオフした状態のマシンが正常終了するでもなく、突然電源が切れるという。起動すると不正終了したとのメッセージが出る。

ふ〜む。先週Microsoftのセキュリティアップデートが適用されているので、ひょっとすると、その影響かも…と思いつつ現場へ急行。
基本的に、使用している時には落ちていないが、未使用時にいつの間にか落ちているらしい。

このマシンは、ショップ組立のAMD搭載フルタワーデスクトップ機。OSはVistaだ。システムを構築する前から利用していて、特定アプリケーションのSQLサーバ兼アプリケーションサーバとして動いていることからほぼ24時間運転している。以前は共有マシンでアカウントを切らずにメール送受信マシンとしても動いていた。
前回、システム導入にともなってアカウントごとにログインさせて、クライアントとして利用し始めたけれども、過去のアプリケーションサーバ等は触らぬマシンに祟り無しというスタンスで、その辺りは手を入れていない。

まずは、ログをチェックしてみる。
終了プロセスの痕跡はない。その後、起動した痕跡は残っている。
先週のアップデートは正しく適用されているし、アップデートによる不具合の報告も上がっていないから、こいつは除外。
さて…。変な常駐ソフトを削る。
msconfigでスタートアップ次の不要なプロセスの起動を停止。
しばらく様子を見るが、再現性はない。

本体をよく見ると…

背面の排気ファンが停止している??
ひょっとして、熱暴走か?と思いつつ足元から引きずり出すが、ホコリまみれ…。

筐体を開けてみると、中はそれ程埃を被っているわけではなかった。

側面の小排気ファンは動作するものの、背面の大型ファンは全く動かない状態。指で回しても動かない程度になっているから、随分前から止まっているようだ。
しかも、よくよくチェックするとCPUフィンに装着してあるファンも動かない。こちらは少し回してやるとヨロヨロと動いて、即停止。

さらに、NVIDIAのグラボのファンも停止している。
はあぁぁぁぁぁ〜。

原因はこれだ。かろうじて側面の小型ファンと電源ファンが風を送ってくれていたものの、CPUとグラボはチンチコチンに熱を持っている。
多分、ユーザが使用して、負荷が上がり作業終了。その間に熱がこもって落ちるという流れらしい。それが先週から急に暖かくなり、まだエアコンを入れるほどの暑さでないという状況がまずかったようだ。ギンギンに部屋を冷やしているような職場なら、多分落ちずに生きながらえてくれていたかも。

それは、それで怖いのだけれども、今回発覚して良かったのか悪かったのか…。

ファンの予備部品など当然ないので、お釈迦になった同型のマシンがないか確認すると、廃棄したマシンがあるというので、チェック。
マザーもCPUも異なるけれど、ケースだけは同じなので、ファンが回るのを確認して、背面のファンのみ取り換える。

グラボもいつ死んでもおかしくないので、オンボードのVideoに切り替える。
これで、しばらくは延命できそうだ。

このままだと、電源もCPUダメージを受けている危険性が高いし、高負荷がかかればCPUファンは停止しているので、落ちる可能性が高い。
事情を話して、急遽新しいマシンを手配することに…。

素人管理者からの質問

現在、一応管理している担当者はいるのだけれど、そこそこパソコンを自分で使っている少し詳しい程度の人。
「やっぱり普通のデスクトップは24時間運転すれば持たないんですかね?」って…。まあ善人の同様なスキルの人が、選択したマシンではあるのだけれど…。

そりゃ、そうでしょ。だてにサーバ機が高い訳じゃないんですよ…。各部品の信頼性も違えば、保守体制も違う。
安いマシンをサーバに使うなら、同じ型を複数台予備として確保するのが当然なんだけど、そこまで考えは回っていない。

しかもビジネス機にNVIDIAの後付グラボとか必要ないし…。ゲームでもする気だったんだろうか。オンボードでVGA出力持っているのに…。選択の基準がよく分からないですわ…。

と、ストレートに答えるのも憚られるので、「車の純正ナビも高いですよね?車内温度が70度〜80度になったり、走行中の振動があっても壊れないような作りになってるんですよ。2〜3万のポータブルナビを車中に設置したままだと、そんな訳にはいかないですよね?」とやんわり説明して終了。

今後の作業も大変

ハードの入れ替えは、購入すれば終わりだし、ドメインに参加させて最低限の設定をすればクライアントとしては利用できる。
問題は、よく分からない業務用のアプリケーションサーバと、SQLサーバのデータと環境の移行が、面倒そう。
といって、現在設置してあるWindows Serverに載せるのは、心配だし…。

なんて事を勘案して見積もらねばならず、厄介な事例ですわぁ。

デスクトップマシンはサーバマシンではないので、代わりに使うのならば、それなりの覚悟と予備部品の確保をしてくださいね〜。

コメント

このブログの人気の投稿

Ubuntu24.04 でGUIが死んだ

VirtualBoxが異常

MEGAにも弱点があった?