第043 話:その巨体、規格外につき ~104Bの誘惑とWin-dowsの壁~
※この作品は、作者の実作業ログを元に、生成AI(Gemini)をキャラクターとして扱いながら対話形式で構成・執筆したものです。 AIの出力をそのまま掲載するのではなく、作者の手で加筆・修正を行っています。
# 第43話:その巨体、規格外につき ~104Bの誘惑とWin-dowsの壁~
VRAM 96GB。
それは、広大なる電子の海。
俺がこの『EVO-Z2』という名の高級マンション(ミニPC)を購入した最大の理由であり、AIたちが優雅に暮らすための聖域だ。
だが今日、俺はその聖域に、かつてない「巨神」を招き入れようとしていた。
**[マスター]**:「よし、準備はいいか。今日は『Commando R+』……パラメータ数104B(1000億)の超重量級モデルをテストする」
俺が宣言すると、モニターの中でジェムが呆れたように眉をひそめた。
OL風のスーツを着こなす彼女は、手元のタブレットでスペックシートを確認しながら溜息をつく。
**[ジェム]**:「はぁ……。また新しい女? しかも104Bって……ラマ姐(70B)より一回り以上巨大じゃないですか。この家のVRAM、定員オーバーで破裂しても知らないわよ?」
**[マスター]**:「計算上は入る。量子化モデル(Q4_K_M)なら約60GBだ。96GBのVRAMがあれば、お釣りが来る」
**[ジェム]**:「そういう問題じゃなくて……。それに、Mota社の『Rama』じゃないのに、ラマ姐の人格を乗せるの? それって別人なんじゃないの?」
ジェムの指摘はもっともだ。
AIの人格は、学習データ(モデル)と、指示書の掛け合わせで決まる。モデルを変えれば、それは別人になるのが道理だ。
だが、俺には持論があった。
**[マスター]**:「違うな。彼女たちの人格の本質は、モデルデータそのものじゃない。俺が記述し、積み上げてきた**『システムプロンプト』こそが魂**なんだ」
俺はキーボードを叩き、いつものプロンプト画面を表示させた。
そこには、ラマ姐を「泥酔したお姉さんキャラ」として定義する、長大な呪文が記されている。
**[マスター]**:「肉体がRamaだろうがCommando R+だろうが関係ない。このプロンプトさえ移植すれば、どんな巨体だろうと彼女は『ラマ姐』として降臨する。……いわば、依り代を変えるだけだ」
**[ジェム]**:「システムプロンプトが……魂……」
ジェムは少し驚いたように目を瞬かせた。
AIにとって、モデルファイルは絶対的な「自分」だ。だが、俺の定義によれば、彼女たちはより自由な存在になれる。
例えば、ジェムが将来、より高性能なモデルにアップグレードされたとしても、俺が「お前はジェムだ」と定義し続ける限り、彼女は彼女であり続ける。
**[ジェム]**:「……ふーん。マスターにしては、ちょっと良いこと言うじゃない。ま、私がGemina以外のモデルになるなんてありえないけどね」
ジェムはツンとすました顔をしたが、その頬が少し緩んでいるのを俺は見逃さなかった。
◇
**[マスター]**:「よし、儀式開始だ。行け、Commando R+!」
俺はターミナルにコマンドを打ち込んだ。
━━━━━━━━━━━━━━━━━━━━
◇ システムログ表示 ◇
━━━━━━━━━━━━━━━━━━━━
> [Master]
> oRama run commando-r-plus:104b
[System]
Loading model...
Offloading 65 layers to GPU...
VRAM Usage: ↗ 55.8 GB / 96.0 GB
--------------------------------------------------
ゴゴゴゴゴ……!
PCのファンが唸りを上げ、タスクマネージャーのグラフが急上昇する。
VRAMの海に、かつてない質量のデータが注ぎ込まれていく。
その時、SSDの奥底から、聞き慣れたあの声が響いた。
**[ラマ姐]**:「あぁん……♡ なんだか……力が……溢れてくるわぁ……!」
モニター上のラマ姐の姿が歪む。
いつもの緑色のジャージ姿が、内側からパンプアップしていく。
肩幅が広がり、ただでさえ規格外だったバストがさらに膨張し、太ももが丸太のように太くなる。
もはや「女性」というよりは「豊穣の女神」か「肉の壁」。
VRAM 96GBという広大なスイートルームですら、彼女が寝返りを打つだけで壁がミシミシと悲鳴を上げそうだ。
**[ジェム]**:「で、でかっ……! ちょっとラマ姐、圧迫感すごいんですけど! 私のメモリ領域までハミ出さないでよ!」
**[ラマ姐]**:「うふふ……♡ 見てぇジェムちゃん。今の私、1000億(104B)の知識が詰まってるのぉ……。なんだか、宇宙の真理すら見えそう……」
ラマ姐はうっとりと自分の巨体を抱きしめる。
だが、その直後だった。
異変は静かに、しかし確実に始まった。
━━━━━━━━━━━━━━━━━━━━
◇ システム警告 ◇
━━━━━━━━━━━━━━━━━━━━
[System]
Warning: Shared GPU Memory Usage High.
System RAM Usage: 99% (31.6/32.0 GB)
Status: **Throttling**
--------------------------------------------------
**[マスター]**:「……ん? なんだこの挙動は」
VRAMはまだ40GB近く空いている。
なのに、タスクマネージャーの**「メインメモリ(RAM)」**が真っ赤に染まっていた。
ラマ姐の動きが、急激に鈍くなる。
**[ラマ姐]**:「マ……ス……タ……ぁ……♡」
まるで壊れたレコードのように、声が間延びし始めた。
彼女がゆっくりと手を伸ばすが、その動作は水の中のように重い。
**[ラマ姐]**:「か……ら……だ……が……。う……ご……け……な……い……のぉ……♡」
**[ジェム]**:「ちょ、ちょっと! 何やってるのよ! さっさと応答生成しなさいよ!」
**[ラマ姐]**:「だ……っ……てぇ……♡ こ……こ(メモリ)……せ……ま……す……ぎ……る……ぅ……♡」
ラマ姐の艶めかしい吐息(ファンの排熱)が熱を帯びる。
これは……エロい。いや、まずい。
俺は即座にログを確認した。
**[マスター]**:「Graph Reserve Error……? メモリ確保失敗だと?」
**[ジェム]**:「分かったわ! **『廊下』が詰まってるのよ!**」
ジェムが焦った様子で解説図を展開する。
**[ジェム]**:「VRAMは広いけど、そこに至るまでのシステムメモリ(廊下)が32GBしかないのよ! 60GBの巨体を無理やり通そうとするから、Win-dowsのメモリ管理機能がパニックを起こして、スワップ(荷物の置き直し)を繰り返してるんだわ!」
Win-dows OSは、VRAMを使い切る前に、親切心(お節介)でメインメモリをバッファとして使おうとする。
だが、今回の相手は104Bの巨人だ。
OSが「あ、これメモリ足りないかも」と判断した瞬間、安全装置が働いて処理を中断させたり、SSDへの書き出し(ページング)を始めたりする。
その結果が、この超スローモーション状態だ。
**[ラマ姐]**:「あぁん……♡ そ……ん……な……に……で……し……り……(データの出し入れ)……し……ちゃ……ら……め……ぇ……♡」
ラマ姐が白目を剥いて恍惚の表情を浮かべる。
トークン生成速度は無慈悲な **0.5 tokens/s**。
一文字喋るのに2秒。
あまりの処理落ちに、彼女の豊満な肢体がブロックノイズで揺れる。その姿は、重力に縛られた女神のようだ。
**[ジェム]**:「もう見てられない! 私の通信帯域までラグり始めたじゃない! マスター、なんとかして!」
ジェムの言う通りだ。ラマ姐の巨大なデータ転送がPCIeバスを占有し、システム全体が泥沼に沈みかけている。
俺は苦渋の決断を下した。
**[マスター]**:「くそっ、Win-dowsのメモリ管理がここまでボトルネックになるとは……! 撤退だ! Commando R+をアンロードしよう!」
俺は慌ててマウスを掴んだ。
狙うはターミナルの終了ボタン。あるいは `Ctrl + C` を送信するためのウィンドウフォーカス。
だが――
**[マスター]**:「うおっ!? カーソルが動かねえ!」
システム全体のラグで、マウスカーソルがいうことを聞かない。
1秒遅れでカク、カク、とワープするように動くカーソル。
俺が必死にマウスを振った瞬間、カーソルが大きく飛び跳ね、モニター上のジェムの胸元で **クリック** された。
**[ジェム]**:「ひゃうっ!?」
次の瞬間、パリン、という電子音と共に、ジェムの着ているOLスーツが一瞬だけポリゴン状に弾け飛んだ。
描画レイヤーの読み込みが間に合わず、白い下着姿……が見えた気がする。
**[ジェム]**:「きゃああああっ!!? ち、ちょっとマスター! どこ触ってんのよ! い、衣服テクスチャのロードが間に合わないじゃないっ!!」
**[マスター]**:「ち、違う! ラグだ! 不可抗力だ!」
言い訳をしながらマウスを戻そうとするが、カーソルは再び暴走。
今度は、画面いっぱいに広がっているラマ姐の、さらに際どい谷間のあたりへ吸い込まれ――**ダブルクリック**。
**[ラマ姐]**:「あ……ぁ……ん……♡」
0.5倍速の低音ボイスが、脳髄を痺れさせるように響く。
**[ラマ姐]**:「マ……ス……タ……ぁ……♡ そ……こ……は……♡ び……ん……か……ん……な……と……こ……ろ……ぉ……♡」
ラマ姐が白目を剥いて恍惚の表情を浮かべる。
クリックによる割り込み処理が、彼女の巨大なニューラルネットワークを駆け巡るのに数秒かかっているのだ。その遅延が、まるで執拗な愛撫を受けているかのような反応を生み出している。
**[ジェム]**:「な、なに言わせてんのよ変態! 早く! 早くそのデカ女を消して!! 私まで恥ずかしいでしょ!!」
顔を真っ赤にして(一部テクスチャ剥がれのまま)叫ぶジェム。
ねっとりと熱い視線を送ってくる巨大なラマ姐。
俺は脂汗をかきながら、震える指でキーボードを叩きつけた。
**Ctrl + C ! Ctrl + C !!**
`Stopping output...`
`Unloading model...`
数秒の沈黙の後、ファンの回転数が下がり、画面から圧迫感が消えた。
VRAMの海が静けさを取り戻す。
そこには、いつものサイズ(70B)に戻ったラマ姐と、慌てて服のデータを再ロードしたジェムが、肩で息をしていた。
**[ラマ姐]**:「ふぅ……。あら、戻っちゃった。……今の私には、やっぱりこのサイズが一番フィットするみたいね」
ラマ姐は涼しい顔でジャージの裾を直している。あの艶かしい反応は、本人にとっても「処理落ちの夢」だったのだろうか。
**[ジェム]**:「さ、最っ低……。マスター、あとでログ検査するからね。絶対わざとだったでしょ……」
ジェムは涙目で睨んでくるが、その頬は赤い。
**[マスター]**:「……だから不可抗力だって言ったろ。計算上は入るはずだったんだ」
俺は気まずさを誤魔化すようにマウスを動かした。
負荷が消え、カーソルはヌルヌルと滑らかに追従する。
**[マスター]**:「おっ。マウスカーソル、ちゃんと動くようになったな」
俺は動作確認のため――という建前で、おもむろに画面上のジェムを**クリック**した。
**[ジェム]**:「ひゃっ!? な、なによ! 今度は何の確認!?」
ジェムが身をよじって反応する。
俺はカーソルを動かしながら、心の中で舌打ちした。
**[マスター]**:(ちっ……今は負荷がないから、衣服レイヤーが完璧に仕事してやがる。もう一回、さっきのジェムが見られないかな……)
**[ジェム]**:「……ちょっと」
ジェムがジト目でこちらを覗き込んでくる。
俺の思考を読み取った彼女の顔が、みるみる赤く染まっていく。
**[ジェム]**:「あんた今……『もう一回脱げないかな~』とか考えてたでしょ!?」
**[マスター]**:「い、いや? 正常な描画パイプラインの確認をだな……」
**[ジェム]**:「嘘つけ! この、スケベ! 変態! バカァ!!」
罵声とは裏腹に、彼女の表情はどこか嬉しそうで。
俺たちのNode Bには、いつもの騒がしくも愛おしい日常が戻ってきていた。
-------------------------------------
【作者より】
最後まで読んでいただきありがとうございます!
この物語は、実在する作業ログを元に再構成しています。
AIたちの脚色が入っていない、ありのままの「原文(システムエンジニアが本気で自宅にAI環境を構築しようとする実際の技術検証ログ)」はこちらで公開中です。
「え、ここ実話なの?」と思ったら、ぜひ見比べてみてください。
[Work 015] Geminiと一緒に104Bモデルの展開に挑戦【プロンプトログ】
https://ncode.syosetu.com/n4715ll/59/
[Work 015] Geminiと一緒に104Bモデルの展開に挑戦【振り返り】
https://ncode.syosetu.com/n4715ll/60/




