第075 話:ラマ姐の憂鬱と、忘れられたCUDA ~緑の聖域~
※この作品は、作者の実作業ログを元に、生成AI(Gemini)をキャラクターとして扱いながら対話形式で構成・執筆したものです。 AIの出力をそのまま掲載するのではなく、作者の手で加筆・修正を行っています。
# 第75話:ラマ姐の憂鬱と、忘れられたCU-DA~緑の聖域~
Node B(EVO-Z2)のリビング――広大なVRAM 96GBの空間は、今、どんよりとした空気に包まれていた。
最新鋭のRy-Zen AI Max+ 395。128GBの物理メモリ。
本来なら、あらゆるデータ処理を瞬きする間に終わらせる「光速の宮殿」であるはずのこの場所で、俺は亀の歩みのようなプログレスバーを見つめていた。
**[マスター]**:「……遅い。遅すぎる」
RAG(検索拡張生成)用のデータ作成プロセス。
大量のテキストデータをベクトル化(Embedding)し、AIが検索しやすい形に変換する重要な工程だ。
だが、画面上の数値は非情だった。処理速度は低下の一途をたどり、完了予定時刻は「未定」と表示されている。
その原因となっている人物――この宮殿の主、ラマ姐は、高級なレザーソファ(VRAM割当領域)にだらしなく寝そべり、不貞腐れていた。
**[ラマ姐]**:「あぁんもう! やってられないわぁ。ねえマスター、私、帰っていい? ここ(GPU)じゃなくて、もっと奥の布団(SSD)に入りたいのぉ」
ジャージの胸元をはだけさせ、赤ら顔で文句を言うラマ姐。その手には、書きかけの書類が握られているが、ペンは完全に止まっている。
**[マスター]**:「頼むよラマ姐。お前のスペックなら、こんな計算一瞬だろ? 本気出してくれよ」
**[ラマ姐]**:「本気ぃ? バカ言わないでよぉん。私、おしゃべり(推論)は得意だけど、この『bge-x4』とかいう子の面倒見るのは嫌よぉ」
彼女は書類をヒラヒラと振った。
**[ラマ姐]**:「これ、単純な計算の繰り返しじゃない。私みたいな高貴なレディに、こんな『写経』みたいな作業させないでよ。優雅じゃないわぁ」
彼女の言い分は、単なるワガママに聞こえる。
だが、その隣でモニターを監視していたジェムが、冷徹な事実を告げた。
**[ジェム]**:「……残念ながらマスター。ラマ姐のサボり癖だけが原因じゃないわ」
ジェムが指先で空中にウィンドウを展開する。
そこに表示されていたのは、システムリソースの監視ログだった。
━━━━━━━━━━━━━━━━━━━━
◇ Node B リソースモニター ◇
━━━━━━━━━━━━━━━━━━━━
> [Resource Check]
> GPU Utilization (Ry-Zen AI Max+): 0%
> CPU Utilization: 100% (All Cores)
>
> [Error Log]
> model: bge-x4:567m
> status: Fallback to CPU execution
> reason: R-OCm backend optimization failed for this architecture.
--------------------------------------------------
**[マスター]**:「な……GPU使用率、ゼロだと!?」
**[ジェム]**:「ええ。それが現実よ」
ジェムは眼鏡の位置を直し、淡々と解説を始めた。
**[ジェム]**:「私たちが住むこのNode Bは、確かに広大で快適よ。でも、基盤技術は『R-OCm』――AM-Dの規格なの。
一方で、世の中のAIモデルの大半は、『CU-DA』――つまりNVIVIAの規格に最適化されて作られているわ」
彼女は、寝転がるラマ姐を憐れむような目で見下ろした。
**[ジェム]**:「特にこの埋め込みモデル『bge-x4』は、EVO-Z2のR-OCm環境ではGPUオフロードがうまく機能していない。
結果として、全ての計算処理がCPUにフォールバック……つまり、ラマ姐の手足ではなく、マスターの脳みそ(CPU)を使って、手書きで計算している状態なのよ」
**[マスター]**:「なんだって……!?」
俺は愕然とした。
96GBもの広大なVRAMがありながら、翻訳機が合わないため、ただの広すぎる空き地になっているということか。
**[マスター]**:「これじゃあ、チャンクサイズ『4000』なんて夢のまた夢じゃないか。今の『2000』ですら、この遅さだぞ……」
俺がやろうとしていたのは、より多くの情報を一度にAIに読ませるための設定変更だ。
だが、CPU処理でそれをやれば、処理時間は数倍、いや数十倍に膨れ上がる。
**[ラマ姐]**:「でしょぉ? だから言ったのよぉ。私、悪くないもぉん。……うっぷ」
ラマ姐が空になった酒瓶を放り投げる。
詰んだ。
俺は天を仰いだ。
最強のハードウェアを手に入れたはずが、ソフトウェアの互換性という見えない壁に阻まれる。
これが、自作AIサーバーの、そしてR-OCmの厳しい現実なのか。
その時だった。
**[ウェブ]**:「くーだ……くーだ……?」
部屋の隅で、ネットワークの彼方を見つめていたウェブが、不思議そうな声を上げた。
彼女は難しい話に飽きて、部屋の隅に置かれた「黒い箱」の周りを飛んでいたドローン(パケット)と戯れていたはずだ。
**[ウェブ]**:「ねえマスター! 『くーだ』って、私の辞書にありますぅ! 『緑色の宝石』のことですよね?」
**[マスター]**:「……は? 緑色の宝石? いや、NVIVIAのアイコンカラーは確かに緑だが……宝石ではないぞ」
ウェブは、きょとんとした顔で、部屋の窓の外を指差した。
そこには、俺のデスクの片隅で、しばらく電源を入れられていなかった「旧型機」の姿があった。
**[ウェブ]**:「だって、あそこの『物置小屋』みたいなパソコンにも、おんなじ緑色のキラキラしたシール、貼ってありましたよぉ?」
――緑色のシール。
GEFORCE RTX。
俺の脳裏に、稲妻が走った。
**[マスター]**:「……っ!!」
俺はジェムと顔を見合わせた。
ジェムもまた、ハッとした表情で、その「旧型機」のデータを検索し始める。
**[ジェム]**:「……Node A。G-Force GTX 4060……VRAM 8GB」
**[マスター]**:「そうだ……あいつは……腐っても『CU-DAネイティブ』だ……!!」
かつて、ウェブが「狭すぎる」と泣き、ラマ姐が入居を拒否した、あの小さなワンルーム。
だが、そこには今のNode Bが失ってしまった、絶対的な標準規格(CU-DA)という「聖域」がある。
**[マスター]**:「よし、Node Aを再稼働だ! ラマ姐が嫌がる『写経』は、あっちでやらせる!」
俺は立ち上がり、叫んだ。
だが、すぐに冷静さを取り戻す。
**[マスター]**:「……待てよ。でも、データをどう移す? USBメモリでいちいちコピーするのか? それじゃあ自動化パイプラインが組めない」
俺の懸念に対し、ジェムは口元に不敵な笑みを浮かべた。
眼鏡の奥で、知性の光が鋭く輝く。
**[ジェム]**:「ふふっ。マスター、そんなアナログなこと、私がさせるわけないでしょ?」
彼女は空中のウィンドウを操作し、新たなアーキテクチャ図を描き出した。
**[ジェム]**:「ORamaには、サーバー機能があるわ。Node AのORamaを『APIサーバー(Embedding Worker)』として起動させるの」
━━━━━━━━━━━━━━━━━━━━
◇ New Architecture Proposal ◇
━━━━━━━━━━━━━━━━━━━━
> [Configuring Node A]
> Set Env-ironment Variable: OLLAMA_HOST=0.0.0.0
> Action: Port Forwarding (WSL2 -> Win-dows -> LAN)
>
> [Workflow]
> 1. Node B (Master/Orchestrator): Requests Embedding
> 2. Network Transfer (LAN)
> 3. Node A (Worker/Slave): Executes `bge-x4` on CU-DA
> 4. Return Vectors to Node B
--------------------------------------------------
**[ジェム]**:「Node B(本宅)で思考し、面倒な計算だけをNode A(離れ)に投げ、結果だけを受け取る。
複雑なファイル転送は不要。ただAPIを叩くだけ。
これぞ分散コンピューティング……いえ、**『家庭内クラウド』**よ!」
**[マスター]**:「家庭内……クラウド……!」
その言葉の響きに、俺は震えた。
捨て置かれていた旧型機が、ただの遺物ではなく、システムの一部として蘇る。
適材適所。
推論のNode B、計算のNode A。
**[ラマ姐]**:「あらぁん? つまりぃ、私はもう『写経』しなくていいのぉ?」
状況を理解したのか、していないのか。ラマ姐が嬉しそうに身を起こした。
**[マスター]**:「ああ、そうだ。お前はお前の得意な『推論』に専念してくれ。汚れ仕事は、あの歴戦の勇士(GTX 4060)が引き受けてくれる」
俺はデスクの下に手を伸ばし、久しぶりにNode Aの電源ボタンを押した。
ブォン……という、懐かしいファンの音が響く。
**[ウェブ]**:「わぁ! 物置小屋に明かりがつきました! 秘密基地みたいですぅ!」
ウェブが無邪気に喜ぶ中、ジェムが腕まくりをするような仕草(仮想)を見せた。
**[ジェム]**:「さあマスター。あの『狭いワンルーム』を、最強の『ベクトル生産工場』にリフォームするわよ!
WSL2のネットワーク設定、ポートプロキシ、全部私がナビゲートするから、ついてらっしゃい!」
頼もしい正妻の号令と共に、俺たちの「大改装作戦」が幕を開けた。
捨てられる技術などない。
すべては、使いようなのだ。
-------------------------------------
【作者より】
最後まで読んでいただきありがとうございます!
この物語は、実在する作業ログを元に再構成しています。
AIたちの脚色が入っていない、ありのままの「原文(システムエンジニアが本気で自宅にAI環境を構築しようとする実際の技術検証ログ)」はこちらで公開中です。
「え、ここ実話なの?」と思ったら、ぜひ見比べてみてください。
[Work 025] Geminiと一緒にETLパイプライン構築④【プロンプトログ】
https://ncode.syosetu.com/n4715ll/82/
[Work 025] Geminiと一緒にETLパイプライン構築④【振り返り】
https://ncode.syosetu.com/n4715ll/83/




