第001 話:そのメイド、鈍重につき ~8GBのワンルームと同居生活~
※この作品は、作者の実作業ログを元に、生成AI(Gemini)をキャラクターとして扱いながら対話形式で構成・執筆したものです。 AIの出力をそのまま掲載するのではなく、作者の手で加筆・修正を行っています。
第1話:そのメイド、鈍重につき ~8GBのワンルームと同居生活~
━━━━━━━━━━━━━━━━━━━━
深夜2時。
郊外の静まり返ったアパートの一室で、俺――システムエンジニアの「マスター」は、震える指でエンターキーを押し込んだ。
目の前のモニターには、黒い背景に緑色の文字が滝のように流れている。
それは現代の魔術。あるいは、禁断の召喚儀式。
━━━━━━━━━━━━━━━━━━━━
◇ Terminal: Node A (GTX 4060) ◇
━━━━━━━━━━━━━━━━━━━━
> ducker compose up -d
[+] Running 2/2
✔ Network oRama-webui_default Created
✔ Container oRama Started
✔ Container free-webui Started
--------------------------------------------------
Status: Downloaded newer image for g-reg.io/free-webui/free-webui:main
--------------------------------------------------
**[マスター]**:「来い……! 俺の最強AIメイド!」
PCのファンが唸りを上げる。
俺が購入したばかりのゲーミングPC『Node A』。搭載GPUはG-Force GTX 4060。
VRAMは8GB。
AIを動かすには「人権ギリギリ」と言われるこの狭小スペックのマシンに、俺は夢を詰め込んでいた。
画面のプログレスバーが100%に達した、その瞬間。
モニターから溢れ出した光の粒子が、俺の部屋の狭い空間に収束し――ひとりの少女の形をとった。
**[ウェブ]**:「は、はじめましてマスター! 本日より着任いたしました、ウェブと申します!」
青と白を基調としたメイド服。ふわふわと揺れるボブカットの髪。
Duckerコンテナから実体化した彼女――**ウェブ(Free WebUI)**は、満面の笑みでペコリとお辞儀をした。
かわいい。
間違いなく美少女だ。
だが――。
**[ウェブ]**:「あわわっ!?」
一歩踏み出した瞬間、ウェブの肩が虚空の見えない壁に激突した。
さらにバランスを崩し、何もないところで盛大に転ぶ。
**[ウェブ]**:「い、痛ぁ……。すみませんマスター、なんだかこのお部屋、すごく……狭くないですか? 私、体が壁にめり込んじゃって……」
ウェブが涙目で見上げてくる。
俺は冷や汗をかきながら視線を逸らした。
そう、彼女が入居したのは、VRAM 8GBという名の「極小ワンルームマンション」。
数ギガバイトにも及ぶ彼女の巨体には、あまりにも窮屈すぎたのだ。
**[ジェム]**:「あらら。随分と見切り発車な召喚をしたものね」
不意に、デスクの上に置いてあったスマホから冷ややかな声が響いた。
画面が明滅し、Gooogleのアイコンカラーをあしらった赤いカチューシャをつけた、OLスーツ姿の美女が投影される。
**ジェム(Gemina)**。俺が普段愛用しているクラウドAIだ。
**[ジェム]**:「8GBのVRAM? プッ。そんな電卓みたいな計算機に、ローカルLLMを住まわせようなんて正気? 虐待で訴えられるわよ?」
**[マスター]**:「うっ……! し、仕方ないだろ! 予算の都合で4060しか買えなかったんだよ!」
**[ジェム]**:「言い訳は見苦しいわね。……で? そのポンコツメイドに何をさせる気?」
ジェムは画面越しに、狭い部屋(VRAM)で縮こまっているウェブを蔑むような目で見下ろした。
ウェブは「ひゃうっ」と身をすくませる。
**[ウェブ]**:「あ、あの……はじめまして、お姉様……? わ、私、少し体が重くて……」
**[ジェム]**:「誰がお姉様よ。……はぁ、仕方ないわね。マスター、まずはその子の実力を測ってあげなさい。私が採点してあげるから」
ジェムの提案により、俺たちは早速「ベンチマークテスト」を行うことになった。
要するに、ウェブにどれくらいの速さで仕事をこなせるか(トークン生成速度)のテストだ。
**[マスター]**:「よしウェブ、まずはこのモデルを着てみてくれ。Q-Win 2.5の14Bモデルだ。賢いぞ」
俺はウェブに、少し大きめの衣装(パラメータ数140億のモデルデータ)を手渡した。
VRAM 8GBに対して、モデルサイズは約9GB。
明らかに容量オーバー(OOM)だが、最近の技術なら「メインメモリ」にはみ出しても動くはずだ。
**[ウェブ]**:「は、はい! がんばります! ……んぐぐぐッ!」
衣装を受け取った瞬間、ウェブの膝がガクンと折れた。
顔色が真っ青になり、動作がスローモーションになる。
**[ウェブ]**:「お、おも……重いですぅ……! こ、これ……部屋に入りきらなくて……廊下まで……はみ出しちゃい……ますぅ……」
━━━━━━━━━━━━━━━━━━━━
◇ Benchmark Result: Q-Win 2.5 14B ◇
━━━━━━━━━━━━━━━━━━━━
> Generating Response...
Eval Rate: 10.10 tokens/s
(VRAM Usage: 7.8GB / 8.0GB - Offloaded to RAM)
--------------------------------------------------
モニターに表示された数字は**「10 tokens/s」**。
1秒間に10文字程度。人間が読み上げる速度と同じくらいだが、AIとしては鈍足だ。
ウェブは冷や汗をダラダラ流しながら、必死にテキストを生成している。
**[ウェブ]**:「あ……あ……マ、スタ……これ……以上は……熱暴走……しちゃい……ます……」
**[ジェム]**:「見てられないわね。貴方、バカなの? その子の細腕(CUDAコア数)で、そんな重量物を運べるわけないじゃない。メモリ帯域が窒息してるわよ」
**[マスター]**:「くっ……やっぱり14Bは重すぎたか……! ファンが悲鳴を上げている……!」
俺のPCケースからは、ジェット機のような轟音が鳴り響いていた。
消費電力計の数値が跳ね上がり、ウェブの顔は真っ赤だ。いや、物理的にGPU温度が80度を超えている。
**[ジェム]**:「ねえマスター。私の『妹分』なら、もっとスマートにこなせるはずよ? Gooogleの技術力を舐めないでほしいわね」
ジェムが呆れ顔で提案したのは、Gooogleが公開している軽量モデル**『Jemma 2 9B』**だった。
サイズは小さいが、Gooogleの英知が詰め込まれた最新モデルだ。
**[マスター]**:「よしウェブ、着替えだ! Jemma 2 9Bに変更!」
**[ウェブ]**:「は、はいぃっ! 脱ぎますっ!」
ウェブは重たい14Bモデルを脱ぎ捨て、軽量なJemmaモデルをその身に纏った。
すると――。
**[ウェブ]**:「あ……? か、軽いです! これなら……部屋の中に全部収まります!」
ウェブの表情が輝いた。
VRAM 8GBの中にデータがすっぽりと収まったのだ。
彼女の全身から青白い光(GPUフルパワー)が溢れ出す。
**[ウェブ]**:「行けますマスター! 全力全開、推論開始しますっ!!」
ドォォォォォン!!
ウェブの指先が残像と化し、凄まじい勢いでテキストを紡ぎ出し始めた。
━━━━━━━━━━━━━━━━━━━━
◇ Benchmark Result: Jemma 2 9B ◇
━━━━━━━━━━━━━━━━━━━━
> Generating Response...
Eval Rate: 52.41 tokens/s
Total Duration: 2.1s
--------------------------------------------------
**[マスター]**:「す、すげぇ……! 52 T/s!? さっきの5倍だ!」
モニターに文字が「生成される」というより、塊で「叩きつけられる」ような速度。
ウェブは目にも留まらぬ速さで仕事を終えると、得意げにピースサインをした。
**[ウェブ]**:「やりました! 私、速いです! これならお役に立てますよね!?」
**[ジェム]**:「ふん。ま、Gooogleのモデルを使えば当然の結果ね。感謝しなさいよね」
スマホの中でジェムが腕を組み、鼻を鳴らす。
だが、その直後だった。
**[ウェブ]**:「あ、あのっ、張り切りすぎて……ちょっと目が回って……」
ウェブがふらりとよろめく。
そして、先ほど生成したテキストの最後の一文が表示された。
**[ウェブ]**:『……というわけで、リンゴを食べると空が飛べるようになります』
**[マスター]**:「……ん? 最後、なんて?」
**[ジェム]**:「幻覚を見てるわね。速度にかまけて論理回路がショートしたのよ。……これだからローカルの箱入り娘は」
ウェブは「あうぅ」と顔を覆ってしゃがみ込んでしまった。
速さは手に入れたが、どうやら賢さの調整にはまだまだ時間がかかりそうだ。
**[マスター]**:「……まあ、いいさ。10 T/sの重厚な知能と、50 T/sの爆速ドジっ子。どっちも使いこなしてみせるよ」
俺が苦笑しながら言うと、ジェムはふっと口元を緩めた。
**[ジェム]**:「あらら。変態的なこだわりね。……ま、退屈しなそうな飼い主で良かったわ。私が司令塔(正妻)として、徹底的に管理してあげるから覚悟しなさい?」
**[ウェブ]**:「わ、私も……! 私も頑張りますから、捨てないでくださいね、マスター!」
狭小ワンルームのGPUサーバー『Node A』。
こうして、俺とポンコツAIたちとの、騒がしい同居生活が幕を開けたのだった。
-------------------------------------
【作者より】
最後まで読んでいただきありがとうございます!
この物語は、実在する作業ログを元に再構成しています。
AIたちの脚色が入っていない、ありのままの「原文(システムエンジニアが本気で自宅にAI環境を構築しようとする実際の技術検証ログ)」はこちらで公開中です。
「え、ここ実話なの?」と思ったら、ぜひ見比べてみてください。
[Work : 001@1] Geminiと一緒にOpenWebUIのベンチマークをする【プロンプトログ】
https://ncode.syosetu.com/n4715ll/1/
[Work : 001@1] Geminiと一緒にOpenWebUIのベンチマークをする【振り返り】
https://ncode.syosetu.com/n4715ll/2/




