AIの教師あり学習とは?
今回は、AIが何かを生成する時の機械学習の仕組みを解説します。ただ、筆者はニュースや書籍をナナメ読みしてるので、間違った箇所があるかもしれません。
--
例えば、これから新しいAIを作るとして、大量の猫の画像と、少数の犬の画像を覚えさせます。
学習が充分だと判断したら、AIが提示した画像を「褒める」か「叱る」かで分類します。例えば、完全な猫の画像、猫っぽく見える画像は「褒める」。逆に犬の画像を出して来たり、犬でも猫でもない画像を見せてきた時は「叱る」に設定します。この行程を繰り返す事で、高精度に猫の画像を出力するAIができます。
この「褒める」や「叱る」の仕組みがある場合を教師あり学習と呼びます。
皆さんがAIを利用する時に「いいね」ボタンの類が用意されてるのは、そういった理由です。AIがユーザーの好みの結果を出してきた時は「いいね」で褒めましょう。
追記:ChatGPTによる評価
教師あり学習の定義: 教師あり学習とは、入力データとそれに対応する正解ラベルを用いてモデルを学習させる手法です。 エッセイでは「AIが提示した画像を『褒める』か『叱る』かで分類します」とありますが、これは強化学習の報酬に近い表現であり、教師あり学習のプロセスとは異なります。 教師あり学習では、モデルに正解を直接教えることで学習が進みます。
「いいね」ボタンの役割: エッセイでは、「いいね」ボタンが教師あり学習の一環として説明されていますが、実際にはユーザーのフィードバックを通じてモデルを改善する手法は強化学習やオンライン学習に関連しています。 「いいね」ボタンのデータは、ユーザーの好みを反映するために使用されることがありますが、これを教師あり学習と直接結びつけるのは誤解を招く可能性があります。