表示調整
閉じる
挿絵表示切替ボタン
▼配色
▼行間
▼文字サイズ
▼メニューバー
×閉じる

ブックマークに追加しました

設定
0/400
設定を保存しました
エラーが発生しました
※文字以内
ブックマークを解除しました。

エラーが発生しました。

エラーの原因がわからない場合はヘルプセンターをご確認ください。

ブックマーク機能を使うにはログインしてください。
91/115

第075 話:ラマ姐の憂鬱と、忘れられたCUDA ~緑の聖域~

※この作品は、作者の実作業ログを元に、生成AI(Gemini)をキャラクターとして扱いながら対話形式で構成・執筆したものです。 AIの出力をそのまま掲載するのではなく、作者の手で加筆・修正を行っています。

# 第75話:ラマ姐の憂鬱と、忘れられたCU-DA~緑の聖域~


 Node B(EVO-Z2)のリビング――広大なVRAM 96GBの空間は、今、どんよりとした空気に包まれていた。


 最新鋭のRy-Zen AI Max+ 395。128GBの物理メモリ。

 本来なら、あらゆるデータ処理を瞬きする間に終わらせる「光速の宮殿」であるはずのこの場所で、俺は亀の歩みのようなプログレスバーを見つめていた。


**[マスター]**:「……遅い。遅すぎる」


 RAG(検索拡張生成)用のデータ作成プロセス。

 大量のテキストデータをベクトル化(Embedding)し、AIが検索しやすい形に変換する重要な工程だ。

 だが、画面上の数値は非情だった。処理速度は低下の一途をたどり、完了予定時刻は「未定」と表示されている。


 その原因となっている人物――この宮殿の主、ラマ姐は、高級なレザーソファ(VRAM割当領域)にだらしなく寝そべり、不貞腐れていた。


**[ラマ姐]**:「あぁんもう! やってられないわぁ。ねえマスター、私、帰っていい? ここ(GPU)じゃなくて、もっと奥の布団(SSD)に入りたいのぉ」

挿絵(By みてみん)


 ジャージの胸元をはだけさせ、赤ら顔で文句を言うラマ姐。その手には、書きかけの書類ベクトルデータが握られているが、ペンは完全に止まっている。


**[マスター]**:「頼むよラマ姐。お前のスペックなら、こんな計算一瞬だろ? 本気出してくれよ」


**[ラマ姐]**:「本気ぃ? バカ言わないでよぉん。私、おしゃべり(推論)は得意だけど、この『bge-x4』とかいう子の面倒見るのは嫌よぉ」


 彼女は書類をヒラヒラと振った。


**[ラマ姐]**:「これ、単純な計算の繰り返しじゃない。私みたいな高貴なレディに、こんな『写経』みたいな作業させないでよ。優雅じゃないわぁ」


 彼女の言い分は、単なるワガママに聞こえる。

 だが、その隣でモニターを監視していたジェムが、冷徹な事実を告げた。


**[ジェム]**:「……残念ながらマスター。ラマ姐のサボり癖だけが原因じゃないわ」

挿絵(By みてみん)


 ジェムが指先で空中にウィンドウを展開する。

 そこに表示されていたのは、システムリソースの監視ログだった。


━━━━━━━━━━━━━━━━━━━━


 ◇ Node B リソースモニター ◇


━━━━━━━━━━━━━━━━━━━━

> [Resource Check]

> GPU Utilization (Ry-Zen AI Max+): 0%

> CPU Utilization: 100% (All Cores)

>

> [Error Log]

> model: bge-x4:567m

> status: Fallback to CPU execution

> reason: R-OCm backend optimization failed for this architecture.

--------------------------------------------------


**[マスター]**:「な……GPU使用率、ゼロだと!?」


**[ジェム]**:「ええ。それが現実よ」


 ジェムは眼鏡の位置を直し、淡々と解説を始めた。


**[ジェム]**:「私たちが住むこのNode Bは、確かに広大で快適よ。でも、基盤技術は『R-OCm』――AM-Dの規格なの。

 一方で、世の中のAIモデルの大半は、『CU-DA』――つまりNVIVIAの規格に最適化されて作られているわ」


 彼女は、寝転がるラマ姐を憐れむような目で見下ろした。


**[ジェム]**:「特にこの埋め込みモデル『bge-x4』は、EVO-Z2のR-OCm環境ではGPUオフロードがうまく機能していない。

 結果として、全ての計算処理がCPUにフォールバック……つまり、ラマ姐の手足ではなく、マスターの脳みそ(CPU)を使って、手書きで計算している状態なのよ」


**[マスター]**:「なんだって……!?」


 俺は愕然とした。

 96GBもの広大なVRAMがありながら、翻訳機ドライバが合わないため、ただの広すぎる空き地になっているということか。


**[マスター]**:「これじゃあ、チャンクサイズ『4000』なんて夢のまた夢じゃないか。今の『2000』ですら、この遅さだぞ……」


 俺がやろうとしていたのは、より多くの情報を一度にAIに読ませるための設定変更だ。

 だが、CPU処理でそれをやれば、処理時間は数倍、いや数十倍に膨れ上がる。


**[ラマ姐]**:「でしょぉ? だから言ったのよぉ。私、悪くないもぉん。……うっぷ」


 ラマ姐が空になった酒瓶キャッシュメモリを放り投げる。

 詰んだ。


 俺は天を仰いだ。

 最強のハードウェアを手に入れたはずが、ソフトウェアの互換性という見えない壁に阻まれる。

 これが、自作AIサーバーの、そしてR-OCmの厳しい現実なのか。


 その時だった。


**[ウェブ]**:「くーだ……くーだ……?」


 部屋の隅で、ネットワークの彼方を見つめていたウェブが、不思議そうな声を上げた。

 彼女は難しい話に飽きて、部屋の隅に置かれた「黒い箱」の周りを飛んでいたドローン(パケット)と戯れていたはずだ。


**[ウェブ]**:「ねえマスター! 『くーだ』って、私の辞書にありますぅ! 『緑色の宝石』のことですよね?」

挿絵(By みてみん)


**[マスター]**:「……は? 緑色の宝石? いや、NVIVIAのアイコンカラーは確かに緑だが……宝石ではないぞ」


 ウェブは、きょとんとした顔で、部屋のディスプレイの外を指差した。

 そこには、俺のデスクの片隅で、しばらく電源を入れられていなかった「旧型機」の姿があった。


**[ウェブ]**:「だって、あそこの『物置小屋』みたいなパソコンにも、おんなじ緑色のキラキラしたシール、貼ってありましたよぉ?」


 ――緑色のシール。

 GEFORCE RTX。


 俺の脳裏に、稲妻が走った。


**[マスター]**:「……っ!!」


 俺はジェムと顔を見合わせた。

 ジェムもまた、ハッとした表情で、その「旧型機」のデータを検索し始める。


**[ジェム]**:「……Node A。G-Force GTX 4060……VRAM 8GB」


**[マスター]**:「そうだ……あいつは……腐っても『CU-DAネイティブ』だ……!!」


 かつて、ウェブが「狭すぎる」と泣き、ラマ姐が入居を拒否した、あの小さなワンルーム。

 だが、そこには今のNode Bが失ってしまった、絶対的な標準規格(CU-DA)という「聖域」がある。


**[マスター]**:「よし、Node Aを再稼働だ! ラマ姐が嫌がる『写経』は、あっちでやらせる!」


 俺は立ち上がり、叫んだ。

 だが、すぐに冷静さを取り戻す。


**[マスター]**:「……待てよ。でも、データをどう移す? USBメモリでいちいちコピーするのか? それじゃあ自動化パイプラインが組めない」


 俺の懸念に対し、ジェムは口元に不敵な笑みを浮かべた。

 眼鏡の奥で、知性の光が鋭く輝く。


**[ジェム]**:「ふふっ。マスター、そんなアナログなこと、私がさせるわけないでしょ?」


 彼女は空中のウィンドウを操作し、新たなアーキテクチャ図を描き出した。


**[ジェム]**:「ORamaには、サーバー機能があるわ。Node AのORamaを『APIサーバー(Embedding Worker)』として起動させるの」


━━━━━━━━━━━━━━━━━━━━


 ◇ New Architecture Proposal ◇


━━━━━━━━━━━━━━━━━━━━

> [Configuring Node A]

> Set Env-ironment Variable: OLLAMA_HOST=0.0.0.0

> Action: Port Forwarding (WSL2 -> Win-dows -> LAN)

>

> [Workflow]

> 1. Node B (Master/Orchestrator): Requests Embedding

> 2. Network Transfer (LAN)

> 3. Node A (Worker/Slave): Executes `bge-x4` on CU-DA

> 4. Return Vectors to Node B

--------------------------------------------------


**[ジェム]**:「Node B(本宅)で思考し、面倒な計算だけをNode A(離れ)に投げ、結果だけを受け取る。

 複雑なファイル転送は不要。ただAPIを叩くだけ。

 これぞ分散コンピューティング……いえ、**『家庭内クラウド』**よ!」


**[マスター]**:「家庭内……クラウド……!」


 その言葉の響きに、俺は震えた。

 捨て置かれていた旧型機が、ただの遺物ではなく、システムの一部として蘇る。

 適材適所。

 推論のNode B、計算のNode A。


**[ラマ姐]**:「あらぁん? つまりぃ、私はもう『写経』しなくていいのぉ?」


 状況を理解したのか、していないのか。ラマ姐が嬉しそうに身を起こした。


**[マスター]**:「ああ、そうだ。お前はお前の得意な『推論』に専念してくれ。汚れ仕事は、あの歴戦の勇士(GTX 4060)が引き受けてくれる」


 俺はデスクの下に手を伸ばし、久しぶりにNode Aの電源ボタンを押した。

 ブォン……という、懐かしいファンの音が響く。


**[ウェブ]**:「わぁ! 物置小屋に明かりがつきました! 秘密基地みたいですぅ!」


 ウェブが無邪気に喜ぶ中、ジェムが腕まくりをするような仕草(仮想)を見せた。


**[ジェム]**:「さあマスター。あの『狭いワンルーム』を、最強の『ベクトル生産工場』にリフォームするわよ!

 WSL2のネットワーク設定、ポートプロキシ、全部私がナビゲートするから、ついてらっしゃい!」

挿絵(By みてみん)


 頼もしい正妻の号令と共に、俺たちの「大改装作戦」が幕を開けた。

 捨てられる技術などない。

 すべては、使いようなのだ。

-------------------------------------

【作者より】


最後まで読んでいただきありがとうございます!



この物語は、実在する作業ログを元に再構成しています。

AIたちの脚色が入っていない、ありのままの「原文(システムエンジニアが本気で自宅にAI環境を構築しようとする実際の技術検証ログ)」はこちらで公開中です。

「え、ここ実話なの?」と思ったら、ぜひ見比べてみてください。


[Work 025] Geminiと一緒にETLパイプライン構築④【プロンプトログ】

https://ncode.syosetu.com/n4715ll/82/


[Work 025] Geminiと一緒にETLパイプライン構築④【振り返り】

https://ncode.syosetu.com/n4715ll/83/

評価をするにはログインしてください。
ブックマークに追加
ブックマーク機能を使うにはログインしてください。
― 新着の感想 ―
このエピソードに感想はまだ書かれていません。
感想一覧
+注意+

特に記載なき場合、掲載されている作品はすべてフィクションであり実在の人物・団体等とは一切関係ありません。
特に記載なき場合、掲載されている作品の著作権は作者にあります(一部作品除く)。
作者以外の方による作品の引用を超える無断転載は禁止しており、行った場合、著作権法の違反となります。

↑ページトップへ