【最新環(huán)境構(gòu)築済】NVIDIA DGX-1 DGX OS 6 / Ubuntu 22.04 Xeon E5-2698v4 メモリ512GB GPUメモリ128GB 検)RTX 5 000 6000 8000 4090 P100 V100 A100 H100

NVIDIA DGX-1 DGX OS 6 / Ubuntu 22.04
Ubuntu 22.04 LTS(jammy)+CUDA 12.2(nvidia-driver-535-server)

最新のDGX OS 6 / Ubuntu 22.04で環(huán)境構(gòu)築(2024年4月時(shí)點(diǎn))ができておりジャンク扱いではなく動(dòng)作するNVLinkの並列GPU&CPUの超ハイメモリ環(huán)境を前提とした価格設(shè)定です。
こちらに興味がある方は少し古い世代だとしても中~大規(guī)模LLMの開(kāi)発などでGPUに併用して大量の物理メモリも欲しいケースがあるのではと存じます。
モデルにもよりますが、例えばl(wèi)lama3-8Bの場(chǎng)合、Transformersのdevice_map="auto"で動(dòng)作させるとNVLinkで8つのGPUに數(shù)GB程度バランスしてロードして並列計(jì)算して結(jié)果を返すので同性能や上位の単一GPUより早い場(chǎng)合もあります。推論マシンや小さいモデルの學(xué)習(xí)としては未だそれなりに使えるはずです。
サーバー室に余裕があれば並列処理を活かして7B-30BぐらいのサイズのLLMをホストして公開(kāi)する環(huán)境として使うのはありだと思います。(勿論他の用途にも)
実際そのように使っており、他に超大規(guī)模の量子化モデルの動(dòng)作テストや小規(guī)模の學(xué)習(xí)などに使っていたのですが、事務(wù)所に関連する都合(他のサーバーを含めた電源の課題や音の課題)で十分に稼働ができないためこの度手放すことに決めました。
売れない場(chǎng)合もメイン環(huán)境のリソースが不足した時(shí)に一時(shí)的に利用するサブ環(huán)境やクラスタ環(huán)境として利用する可能性があるのでこの価格でも欲しい方向けに出しています。

出荷ロットにもよるかもしれませんが、正直この製品は非サポート狀態(tài)で高い値段でジャンクガチャをすると調(diào)査工數(shù)等がそれなりに必要です。場(chǎng)合によってはDGX OSのUbuntu環(huán)境が作れない可能性もあると思います。(元はそういう狀態(tài)で購(gòu)入し、購(gòu)入後に環(huán)境が作れず絶望し、かなり後悔もしました)
何の手掛かりもなしで環(huán)境構(gòu)築すると正直何度も心が折られます。元の価格は軽く1000萬(wàn)円以上するので多少問(wèn)題があってもNvidia擔(dān)當(dāng)者が張り付いて保守などで丁寧にサポートしていたのではないかと推測(cè)しています。

【ハード詳細(xì)】
Xeon E5-2698v4 (CPUx2)  20コア40スレッド 2.20~3.60GHz
メモリ 512GB (32GB x16)
ディスク SSD  480GB + 1.92TB ※DGX-1デフォルトより少ないです。勿論追加可能です。
GPU Tesla P100 128GB (16GB x 8)
電源 200V 50/60Hz  10A (x4) ※200Vのみ利用可
3Uサイズ W484×D950×H135 (mm) / 約60kg
※出品物はDGX-1本體のみでその他は一切付屬しません。
 動(dòng)作には一般的な200Vサーバ用電源タップやコードなどが必要です。

初期出荷時(shí)の狀態(tài)が正確にはわかりませんが、正面のディスクマウントを隠すための蓋の固定用のピンがありません。ただし、磁石になっているのでピンがなくても蓋は固定はできています。
その他傷や汚れが多くあります?,F(xiàn)狀の配置の都合でサーバラック固定ではなく機(jī)に置いており、筐體まわりでその他細(xì)かい不備がないか不明です。(目視では問(wèn)題なさそうに見(jiàn)えますが筐體外観についてノークレームでお願(yuàn)いします)

【內(nèi)容説明】
前置きが長(zhǎng)くなりましたが、ここからもう少し具體的な中身の説明です。
ディスクはRAID0で、Ubuntu 22.04 LTS(jammy)+CUDA 12.2(nvidia-driver-535-server)のDGX OS6の最新環(huán)境で構(gòu)築済みです。

環(huán)境構(gòu)築した現(xiàn)在のUbuntuのままお引渡し予定です。
狀態(tài)を簡(jiǎn)単に説明すると、社內(nèi)ネットワークからSSHログインで利用ができており、NVlinkで8つのGPUがつながっていること、pytorchを入れてLLMが連結(jié)したGPUで動(dòng)作することを確認(rèn)しています。
※DGX OSに関する全機(jī)能がテストできている訳ではないことをご了承ください

こちらは元々ディスクが個(gè)別に初期化された動(dòng)作不明の中古品として入手しました。初期化狀態(tài)からのUbuntu環(huán)境構(gòu)築に時(shí)間がかかり一旦の放置期間を含め1年以上かけて時(shí)間のある時(shí)に調(diào)査しながら右往左往してようやくDGX 最新環(huán)境を入れるまで辿り著きました。
初期インストールの課題解決も大変なのですが、DGXでは古いUbuntuからのアップグレードにも問(wèn)題があるらしく解決方法を調(diào)べても最終的にNVIDIA擔(dān)當(dāng)に連絡(luò)してくれとなっているケースばかりでなので色々と問(wèn)題がある様子は伺えます。

元がプレミアム価格で多くの人が手にするものでないこと、新規(guī)購(gòu)入の場(chǎng)合はセットアップされておりNVIDIA擔(dān)當(dāng)のサポートもついていることから、サポートなしで初期化から最新環(huán)境へセットアップする人口はかなり限られていると想定されます。よって、ネット上には情報(bào)がほぼなくさらには現(xiàn)狀は手順情報(bào)にも不足點(diǎn)がありUbuntuのインストールにかなり難航しました。
(探すとDGX OS込みのISOと公式UbuntuにDGXツールを後入れする方法が見(jiàn)つかりますがどちらも普通にやると途中でインストールエラーになります。これは出荷ロット等に依存するものかもしれません)

ここ數(shù)年で世界的にA100/H100等が売れたことが関係すると思われますが、ここ1年の間にNVIDIAのWEBサイトでDGX関連の手順情報(bào)等が実は充実してきました。しかし、現(xiàn)狀の情報(bào)通りにやってもこのDGX-1では未だUbuntuインストールに失敗します???
様々な入れ方を試したり、ログを解析したり、問(wèn)題切り分けのためにWindows Serverインストーラで試したりしてハードそのものに問(wèn)題はなさそうなことは把握しつつ、最近になってようやくDGX最新環(huán)境としてセットアップができました。
※Ubuntuの入れ方は簡(jiǎn)単なメモとしてノウハウを共有します(どうやってもインストールが無(wú)理だったので最初はWindows Serverを入れて使っていました)

そもそもの問(wèn)題がUbuntu側(cè)なのかDGXのRAIDコントローラー等の問(wèn)題なのかなどの詳細(xì)までは切り分けられていませんが、このようにすると完全初期化狀態(tài)からRAID設(shè)定をしてさらにUbuntuインストールまで完了したという情報(bào)を引き継ぎます。
詳細(xì)マニュアルではなくこの情報(bào)を參照しながらこれらの分岐をこっちに回避してこうするとインストールまで辿り著けるというメモ書き程度のものです。

GPUはやや古い世代にはなりますが、DGXの最新環(huán)境が入っていること(DGXのサポートしている最新がUbuntu 22.04)であることと、GPUメモリ128GBと実メモリ512GBが積まれているのは魅力的に映る利用ケースはあるのではないでしょうか。
Windows Serverとして転用しても潰しがきくと思います。実際Windwos Serverとしても一時(shí)期動(dòng)作させていましたが、仮にファイルサーバやVDIサーバなどの目的で使うとしても2024年時(shí)點(diǎn)で十分なスペックです。

発売時(shí)価格は12萬(wàn)9000ドルの世界初のディープラーニング用のスパコンですのでその歴史的価値やこのハード?ソフトを扱うことでの教育的価値もあるかと思います。

【発送について】
単體だと重量の都合で輸送會(huì)社の條件に合わないので、GPUモジュールを外して2小口の発送となります。到著後に分離されたGPUモジュールを押し込んで付ける作業(yè)が必要です。ご了承ください

現(xiàn)時(shí)點(diǎn)で配送は愛(ài)知県から飛腳ラージサイズ260(50kgまで)で2個(gè)口を想定していますが、詳細(xì)はどうなるかわからないので1個(gè)口として東京までの8,420円を設(shè)定して送料は一律とします。恐らくこれ以上を超える送料がかかると思いますが殘りはこちらで負(fù)擔(dān)します。

恐れ入りますが、発送先が沖縄?北海道?離島の場(chǎng)合は送料は別途追加となりますので事前にご連絡(luò)お願(yuàn)いします。
また、配送業(yè)者との調(diào)整が必要になるため発送までに1週間程度お待ちいただきます。

【その他】
ご落札後にご依頼いただければ、適格請(qǐng)求書発行事業(yè)者登録番號(hào)付き(インボイス対応)の領(lǐng)収書を発行可能です。

最新環(huán)境のDGX OSとCUDAインストールが完了しており、pytorchも動(dòng)作確認(rèn)ができている狀態(tài)でお渡しできるのですぐにGPU又はGPU込みのハイメモリ環(huán)境を利用されたい方にとっては大きなポイントになるかなと思います。
繰り返しとなりますが、到著後に電源を入れ環(huán)境へログインできて以降のサポート等は一切できませんのでご了承お願(yuàn)いいたします。(先の説明の通りOSの入れ方も公開(kāi)情報(bào)通りには入れていません)

高価なものなので丁寧に説明は書いたつもりですが手探りでDGX-1を觸ってきたので合ってない部分があるかもしれません。一度他者に渡った中古品であることを前提にノークレーム?ノーリターンにご協(xié)力できる方のみご入札いただければ幸いです。
※現(xiàn)在普通に利用できているものなのでいわゆる逃げのためのジャンク扱いなどの意味ではなく、起動(dòng)するにも利用するにも広範(fàn)囲で専門的な話を多く含むのでノーサポート?ノークレーム?ノーリターンであることをご了承ください