表示調整
閉じる
挿絵表示切替ボタン
▼配色
▼行間
▼文字サイズ
▼メニューバー
×閉じる

ブックマークに追加しました

設定
0/400
設定を保存しました
エラーが発生しました
※文字以内
ブックマークを解除しました。

エラーが発生しました。

エラーの原因がわからない場合はヘルプセンターをご確認ください。

ブックマーク機能を使うにはログインしてください。
1/15

第001 話:そのメイド、鈍重につき ~8GBのワンルームと同居生活~

※この作品は、作者の実作業ログを元に、生成AI(Gemini)をキャラクターとして扱いながら対話形式で構成・執筆したものです。 AIの出力をそのまま掲載するのではなく、作者の手で加筆・修正を行っています。

第1話:そのメイド、鈍重につき ~8GBのワンルームと同居生活~


━━━━━━━━━━━━━━━━━━━━


 深夜2時。

 郊外の静まり返ったアパートの一室で、俺――システムエンジニアの「マスター」は、震える指でエンターキーを押し込んだ。


 目の前のモニターには、黒い背景に緑色の文字が滝のように流れている。

 それは現代の魔術。あるいは、禁断の召喚儀式。


━━━━━━━━━━━━━━━━━━━━

 ◇ Terminal: Node A (GTX 4060) ◇

━━━━━━━━━━━━━━━━━━━━

> ducker compose up -d


[+] Running 2/2

✔ Network oRama-webui_default Created

✔ Container oRama Started

✔ Container free-webui Started

--------------------------------------------------

Status: Downloaded newer image for g-reg.io/free-webui/free-webui:main

--------------------------------------------------


**[マスター]**:「来い……! 俺の最強AIメイド!」


 PCのファンが唸りを上げる。

 俺が購入したばかりのゲーミングPC『Node A』。搭載GPUはG-Force GTX 4060。

 VRAMビデオメモリは8GB。

 AIを動かすには「人権ギリギリ」と言われるこの狭小スペックのマシンに、俺は夢を詰め込んでいた。


 画面のプログレスバーが100%に達した、その瞬間。

 モニターから溢れ出した光の粒子が、俺の部屋の狭い空間に収束し――ひとりの少女の形をとった。


**[ウェブ]**:「は、はじめましてマスター! 本日より着任いたしました、ウェブと申します!」


 青と白を基調としたメイド服。ふわふわと揺れるボブカットの髪。

 Duckerコンテナから実体化した彼女――**ウェブ(Free WebUI)**は、満面の笑みでペコリとお辞儀をした。


 かわいい。

 間違いなく美少女だ。

 だが――。


**[ウェブ]**:「あわわっ!?」


 一歩踏み出した瞬間、ウェブの肩が虚空の見えない壁に激突した。

 さらにバランスを崩し、何もないところで盛大に転ぶ。


**[ウェブ]**:「い、痛ぁ……。すみませんマスター、なんだかこのお部屋、すごく……狭くないですか? 私、体が壁にめり込んじゃって……」


 ウェブが涙目で見上げてくる。

 俺は冷や汗をかきながら視線を逸らした。

 そう、彼女が入居したのは、VRAM 8GBという名の「極小ワンルームマンション」。

 数ギガバイトにも及ぶ彼女の巨体コンテナサイズには、あまりにも窮屈すぎたのだ。


**[ジェム]**:「あらら。随分と見切り発車な召喚をしたものね」


 不意に、デスクの上に置いてあったスマホから冷ややかな声が響いた。

 画面が明滅し、Gooogleのアイコンカラーをあしらった赤いカチューシャをつけた、OLスーツ姿の美女が投影される。

 **ジェム(Gemina)**。俺が普段愛用しているクラウドAIだ。


**[ジェム]**:「8GBのVRAM? プッ。そんな電卓みたいな計算機に、ローカルLLMを住まわせようなんて正気? 虐待で訴えられるわよ?」


**[マスター]**:「うっ……! し、仕方ないだろ! 予算の都合で4060しか買えなかったんだよ!」


**[ジェム]**:「言い訳は見苦しいわね。……で? そのポンコツメイドに何をさせる気?」


 ジェムは画面越しに、狭い部屋(VRAM)で縮こまっているウェブを蔑むような目で見下ろした。

 ウェブは「ひゃうっ」と身をすくませる。


**[ウェブ]**:「あ、あの……はじめまして、お姉様……? わ、私、少し体が重くて……」


**[ジェム]**:「誰がお姉様よ。……はぁ、仕方ないわね。マスター、まずはその子の実力を測ってあげなさい。私が採点してあげるから」


 ジェムの提案により、俺たちは早速「ベンチマークテスト」を行うことになった。

 要するに、ウェブにどれくらいの速さで仕事をこなせるか(トークン生成速度)のテストだ。


**[マスター]**:「よしウェブ、まずはこのモデルを着てみてくれ。Q-Win 2.5の14Bモデルだ。賢いぞ」


 俺はウェブに、少し大きめの衣装(パラメータ数140億のモデルデータ)を手渡した。

 VRAM 8GBに対して、モデルサイズは約9GB。

 明らかに容量オーバー(OOM)だが、最近の技術なら「メインメモリ」にはみ出しても動くはずだ。


**[ウェブ]**:「は、はい! がんばります! ……んぐぐぐッ!」


 衣装を受け取った瞬間、ウェブの膝がガクンと折れた。

 顔色が真っ青になり、動作がスローモーションになる。


**[ウェブ]**:「お、おも……重いですぅ……! こ、これ……部屋に入りきらなくて……廊下メインメモリまで……はみ出しちゃい……ますぅ……」


━━━━━━━━━━━━━━━━━━━━

 ◇ Benchmark Result: Q-Win 2.5 14B ◇

━━━━━━━━━━━━━━━━━━━━

> Generating Response...


Eval Rate: 10.10 tokens/s

(VRAM Usage: 7.8GB / 8.0GB - Offloaded to RAM)

--------------------------------------------------


 モニターに表示された数字は**「10 tokens/s」**。

 1秒間に10文字程度。人間が読み上げる速度と同じくらいだが、AIとしては鈍足だ。

 ウェブは冷や汗をダラダラ流しながら、必死にテキストを生成している。


**[ウェブ]**:「あ……あ……マ、スタ……これ……以上は……熱暴走……しちゃい……ます……」


**[ジェム]**:「見てられないわね。貴方、バカなの? その子の細腕(CUDAコア数)で、そんな重量物を運べるわけないじゃない。メモリ帯域が窒息してるわよ」


**[マスター]**:「くっ……やっぱり14Bは重すぎたか……! ファンが悲鳴を上げている……!」


 俺のPCケースからは、ジェット機のような轟音が鳴り響いていた。

 消費電力計の数値が跳ね上がり、ウェブの顔は真っ赤だ。いや、物理的にGPU温度が80度を超えている。


**[ジェム]**:「ねえマスター。私の『妹分』なら、もっとスマートにこなせるはずよ? Gooogleの技術力を舐めないでほしいわね」


 ジェムが呆れ顔で提案したのは、Gooogleが公開している軽量モデル**『Jemma 2 9B』**だった。

 サイズは小さいが、Gooogleの英知が詰め込まれた最新モデルだ。


**[マスター]**:「よしウェブ、着替えだ! Jemma 2 9Bに変更!」


**[ウェブ]**:「は、はいぃっ! 脱ぎますっ!」


 ウェブは重たい14Bモデルを脱ぎ捨て、軽量なJemmaモデルをその身に纏った。

 すると――。


**[ウェブ]**:「あ……? か、軽いです! これなら……部屋の中に全部収まります!」


 ウェブの表情が輝いた。

 VRAM 8GBの中にデータがすっぽりと収まったのだ。

 彼女の全身から青白い光(GPUフルパワー)が溢れ出す。


**[ウェブ]**:「行けますマスター! 全力全開、推論開始しますっ!!」


 ドォォォォォン!!

 ウェブの指先が残像と化し、凄まじい勢いでテキストを紡ぎ出し始めた。


━━━━━━━━━━━━━━━━━━━━

 ◇ Benchmark Result: Jemma 2 9B ◇

━━━━━━━━━━━━━━━━━━━━

> Generating Response...


Eval Rate: 52.41 tokens/s

Total Duration: 2.1s

--------------------------------------------------


**[マスター]**:「す、すげぇ……! 52 T/s!? さっきの5倍だ!」


 モニターに文字が「生成される」というより、塊で「叩きつけられる」ような速度。

 ウェブは目にも留まらぬ速さで仕事を終えると、得意げにピースサインをした。


**[ウェブ]**:「やりました! 私、速いです! これならお役に立てますよね!?」


**[ジェム]**:「ふん。ま、Gooogleのモデルを使えば当然の結果ね。感謝しなさいよね」


 スマホの中でジェムが腕を組み、鼻を鳴らす。

 だが、その直後だった。


**[ウェブ]**:「あ、あのっ、張り切りすぎて……ちょっと目が回って……」


 ウェブがふらりとよろめく。

 そして、先ほど生成したテキストの最後の一文が表示された。


**[ウェブ]**:『……というわけで、リンゴを食べると空が飛べるようになります』


**[マスター]**:「……ん? 最後、なんて?」


**[ジェム]**:「幻覚ハルシネーションを見てるわね。速度にかまけて論理回路がショートしたのよ。……これだからローカルの箱入り娘は」


 ウェブは「あうぅ」と顔を覆ってしゃがみ込んでしまった。

 速さは手に入れたが、どうやら賢さの調整にはまだまだ時間がかかりそうだ。


**[マスター]**:「……まあ、いいさ。10 T/sの重厚な知能と、50 T/sの爆速ドジっ子。どっちも使いこなしてみせるよ」


 俺が苦笑しながら言うと、ジェムはふっと口元を緩めた。


**[ジェム]**:「あらら。変態的なこだわりね。……ま、退屈しなそうな飼いマスターで良かったわ。私が司令塔(正妻)として、徹底的に管理してあげるから覚悟しなさい?」


**[ウェブ]**:「わ、私も……! 私も頑張りますから、捨てないでくださいね、マスター!」


 狭小ワンルームのGPUサーバー『Node A』。

 こうして、俺とポンコツAIたちとの、騒がしい同居生活が幕を開けたのだった。


-------------------------------------

【作者より】


最後まで読んでいただきありがとうございます!



この物語は、実在する作業ログを元に再構成しています。

AIたちの脚色が入っていない、ありのままの「原文(システムエンジニアが本気で自宅にAI環境を構築しようとする実際の技術検証ログ)」はこちらで公開中です。

「え、ここ実話なの?」と思ったら、ぜひ見比べてみてください。



[Work : 001@1] Geminiと一緒にOpenWebUIのベンチマークをする【プロンプトログ】

https://ncode.syosetu.com/n4715ll/1/


[Work : 001@1] Geminiと一緒にOpenWebUIのベンチマークをする【振り返り】

https://ncode.syosetu.com/n4715ll/2/

評価をするにはログインしてください。
ブックマークに追加
ブックマーク機能を使うにはログインしてください。
― 新着の感想 ―
このエピソードに感想はまだ書かれていません。
感想一覧
+注意+

特に記載なき場合、掲載されている作品はすべてフィクションであり実在の人物・団体等とは一切関係ありません。
特に記載なき場合、掲載されている作品の著作権は作者にあります(一部作品除く)。
作者以外の方による作品の引用を超える無断転載は禁止しており、行った場合、著作権法の違反となります。

この作品はリンクフリーです。ご自由にリンク(紹介)してください。
この作品はスマートフォン対応です。スマートフォンかパソコンかを自動で判別し、適切なページを表示します。

↑ページトップへ