その6「タグ」
■ プロローグ: タグ付け
ソーシャルサービスに写真をアップロードする際に、その写真に写っているものや情景が「タグ」として表示された経験はないだろうか。たとえば屋外や場所の名前、犬や猫といった写っている動物の種類、食べ物などだ。また、写真アプリでは映し出されている人をカテゴライズして、その人だけをまとめて一覧化してくれる機能もある。
こうした機能のベースになっているのが、既存の写真に対する「タグ付け」だ。ある写真に対して「二人の人」「犬」「ケーキ」「誕生日」といったタグを付けることで、写真とタグを組み合わせてAIが学習する。そうして膨大な写真を学習することで、あなたが撮影した写真に対してそれらしいタグを提案できるのだ。
写真には位置情報やExifといったメタ情報もあるが、こうした情報はプライバシー漏洩の危険があるため、ソーシャルサービスにアップロードする際には削除されるのが基本である。
■ 第1章: ストーキング
22歳の若手アイドル、白石彩奈が突然の活動停止を発表した。地下アイドルから活動を開始して4年目、名前も知られてきて、そろそろブレイクかと言われていたタイミングでの活動休止の発表に、ファンは少なからず動揺した。
その要因はリリースの中にある「ストーカー被害」にあったようだ。後日ニュースで発表された内容によると、自宅のマンションまで男が現れ、襲われそうになったらしい。なぜ自宅バレしたかは分からないが、コンサートの現場からつけられたのかも知れない。幸い、付近にいた男性に助けられて、ストーカーは逮捕されたとのことだ。
ファンはストーカーに対してはもちろんのこと、白石を守れなかった運営に対しても憤りを感じていた。ソーシャルサービスや掲示板、ファンサイトなどでは白石を心配する声や、運営に対する文句などが日々繰り返し投稿されている。
白石の発表から1週間後、次に活動休止を発表したのが中村杏奈だった。彼女はトップアイドルの一人であったにも関わらず、白石と同じくストーカー被害に遭っていたらしい。中村については十分に知名度も高いアイドルだったため、プライベートについては十分な注意をされていたにも関わらずだ。
このアイドル二人の立て続けの活動休止に、ファンは怒りと同時に、次は別な人が被害に遭うのではないかと不気味な予感すら感じていた。
■ 第2章: ソーシャル投稿
田中誠は、数多い白石ファンの一人だ。今回の活動休止を受けて、大きなショックを受けていた。古参のファンとして、4年間白石を追いかけ続けてきた。最初に出会ったのが28歳の時で、彼女は14歳だった。今は30歳を越え、徐々に若々しさが衰え始めている。それだけに、18歳になった白石の眩しいばかりの輝きに魅せられている。
白石を最初に見たのはソーシャルメディアだった。ファンの誰かが撮影した、イベントの動画だった。その頃は中学生だった白石だが、他のメンバーと息の合ったダンスを踊っていた。小さな身体を必死に動かして踊っている様子は、田中の心を掴んで離さなかった。そしてイベントに足を運び、一気に虜になってしまったのだ。
田中自身もソーシャルメディアが大好きであり、もちろん白石をフォローしている。ほぼ毎日のように投稿される写真を見て、癒やされていたのだ。それなのに、突然の活動休止によって、寂しい気持ちでいっぱいだった。今も更新されない白石のアカウントを眺めている。
「ああ…白たん、いつになったら帰ってきてくれるんだろう…」
『白たん』というのは白石のあだ名だ。プロフィールページの白石は、まぶしいばかりの笑顔を田中に見せている。まさにこれから全国区になろうかという勢いを感じさせる笑顔だ。この笑顔が見られなくなったと思うと、胸が締め付けられる。
ふと、田中は目の前の写真を撮影した。東京の高層ビルに囲まれた景色は、とても空が小さく見える。数多くの車が行き交う中で撮影された写真は全くの静寂で、目の前の喧噪とはかけ離れたものに見える。田中は『#白たん がいない空はとても小さいよ #復帰切望』とコメントをつけて写真を投稿した。
田中自身、ソーシャルサービスは日々使いこなしており、写真を頻繁に投稿している。他のファンと交流したり、投稿されているファンによる写真を見て心を躍らせている。現在も『#白たん』のハッシュタグには、ファンの寂しがる声や過去のイベントでの写真が投稿されており、みんなで慰め合っているのだ。会社からの帰宅時間ということもあって、田中の先ほどの投稿に対していいねが早速ついた。
「それにしても、ストーカーか…どこからバレたんだろうな…」
一ファンとしては、見守っているだけで幸せを感じなければならない。住所を探り当てて、そこに行くなんて行為はやってはならないのだ。それは分かっていつつも、心の中の弱さとして自分の白石の住んでいる場所が分かったら、行ってしまうのではないかという欲求も内在している。それがストーカーによる活動休止という発表を見た時から、田中の心のわだかまりとして残り続けている。
■ 第3章: タグ付け
白石ショックはあれど、日々の生活は変わらずやってくる。田中もそれは変わらない。毎日会社に行かなければならず、そこでコンピュータに相対している。田中の仕事はシステムエンジニアであり、経営陣の要望に合わせて、さまざまなシステムを開発している。最近は、他の企業と同じくAI向けの開発がメインになっている。
「田中さん、この画像データをタグ付けしてってさ」
同僚の佐藤翔太から声をかけられた。渡されたデータを確認すると、ざっと5万枚の写真データがある。工場や部品、工作機械の写真であり、これらの画像を真のデータ、いわゆる教師データとして利用するのだ。教師データになる写真に対して正しくタグを付けて、AIに学ばせる。そうすることで、新しい写真を見た時に、その写真が何であるかAIが判別できるのだ。
5万枚の写真ではあるが、実際にはこの写真を回転、反転、切り取りなどを行ってデータ量を増やす必要がある。そうすることで、よりAIの精度を高めていくのだ。つまり、実際にタグ付けを行うべき写真はこの数十倍にも増える可能性がある。
となれば、とても人手で行っていくのは現実的ではない。そのため、そうしたタグ付けを自動で行ってくれるソフトウェアやサービスも存在する。
「とりあえずテストパイロット版だし、自動ツールでも使おうか」
「そうだな。じゃぁ割と精度が良いって話のTaggerでも試してみるかな」
佐藤はそういって、Web検索からTaggerを開いた。そして、テストとして1枚の写真をアップロードする。工場の中を俯瞰的に撮影した写真だが「factory」「machines」「green floor」「3 workers」といったタグが表示された。悪くない認識精度だ。
「良さそうだな。じゃあ、まとめてやっちゃおうか」
「え〜と。料金表は、と。これ面白いな。写真枚数じゃなくて、タグ精度で課金額が変わるらしいぞ」
佐藤の言葉に、田中も身を乗り出して料金表を確認した。確かに、無料でタグ付け無制限とある。精度を上げる、つまり写真の解析量を増やすと料金が上がるらしい。料金は1枚0.2ドルからはじまるのだが、料金のスライダーをマックスまで引き上げると1枚2,000ドルになる。
「どんな料金体系だよ、1枚2,000ドルって」
佐藤は笑って言った。確かに、たかがタグ付けで2,000ドルも払うのは信じられない。しかも無料版でも十分に良い結果が返ってきたのだ。これ以上、どう精度が上がるというのだ。
「これは無料版で良さそうだな」
田中はそういって、写真のタグ付けを行う準備を進めた。平静を装って作業を進めたが、若干心の奥底に刺さるものを感じた。
■ 第4章: 解析
その日の夜、自宅に帰った田中は自宅のコンピュータを立ち上げていた。帰り道の間もずっと、あのTaggerのことが頭に引っかかっていたのだ。タグ付けに課金するのは良いとして、何が違うというのだろうか。そんなにすごい解析技術なのだろうか。
田中は先日撮影した、道路の写真をアップロードした。タグ付けは一瞬で終わり「road」「building」「evening」と出力される。まあ、こんなものだろう。
「試してみないと分からない、か」
田中は覚悟を決めて、会員登録とクレジットカードの登録を行った。登録自体は簡単に終わり、もう一度同じ写真で試す。課金額は0.2ドルだ。今回は数秒待たされた後、「road」「building」「7pm」「tokyo」と出力された。
増えたタグに対してドキリとする。午後7時、確かに写真を撮影した時間と一致する。そして東京というのも一致する。とはいえ、考えてみればさほど難しいものではない。写真の撮影日時はExifから取れるし、位置情報だって残っているかも知れない。
そこで、Exifを修正するツールを立ち上げて、別の写真に埋め込まれている情報を編集した。今回は、千葉の寿司屋で撮影したお吸い物の写真だ。これを再度、0.2ドルの課金で投稿する。
「なんだ、これ…」
出力されたタグは「chiba」「japanese soup」「sushi restaurant」「counter」「bowl」だ。なぜ、この写真で千葉という特定ができるのか。カウンター、と出るのもおかしい。お吸い物の椀だけを写しているのだから、そんな情報は分かろうはずもないのだ。
田中は再度、同じ写真をアップロードする。次は5ドルの課金にした。ざっと考えても、25倍の精度が期待できる。結果は「sodegaura(袖ケ浦)」「sea bream(鯛)」「wheat gluten(お麩)」「japanese soup」「sushi restaurant」「counter」「bowl」と出力された。なぜ、この写真で場所が袖ケ浦だと分かるのか。お椀の中身が鯛のお吸い物だというのも正解だ。
「これ、2,000ドル払うとどうなるんだろう…」
何かがおかしい。論理的に考えても、なぜこんな結果になるのかが理解できない。写真の中に存在しない情報まで読み取っているとしか思えない。田中は自分の頭がおかしくなっていると感じつつ、ソーシャルサービスを立ち上げ、白石彩奈のプロフィールページを開いた。そして、並んでいる写真の中から、自宅の部屋で撮影したとおぼしき写真をダウンロードした。
ダウンロードした写真をアップロードし、課金のスライダーをマックスまで引き上げる。このワンクリックで2,000ドルが課金される。心臓が早鐘を打ち、自分がまずいことをしようとしているのを理解している。押してはいけないと分かっていつつ、田中は解析を実行した。
今回は解析に時間がかかっている。そして、タグもまとめてではなく、順番に一つずつ出てくる。
「tokyo」「4PM」「2024-09-10」「kichijoji」「motocho」「5-19-x」「mezon KES」「512」「080-xxxx-xxxx」
田中には確信めいた予感があった。おそらくストーカーもTaggerを使ったのだ。そして、住所を掴んでストーキングに及んだのだ。
タグがさらに続けて出力されていく。
「cake」「patisserie kichijoji」「man」「lover」「engagement」