第43話 なんでもできる
「ヒカルちゃんなんでもできるんですね」
高崎くんは感心したように言う。
中学生という若さでいろいろプログラムが書けるということでなんだか魔法みたいにみえているようだ。
実際にはそういうことではなく、特化して得意な部分があるということだ。
「なんでもできるわけじゃないとは思うけど、彼女のスキルは基本が強くて応用が効くんだよね」
僕は補足して説明する。必ず必要になるが、ビジネスの現場ではなかなか習得が難しい技術を彼女は持っていた。
「基本??」
高崎くんが聞く。どこからどこまでが基本でどこからどこまでが応用かという話はなかなか難しいとは思うけどヒカルちゃんのような技術者がいないと実際データサイエンスはなかなか進まない。
「つまり根性があるってことだね」
僕がざっくりと説明する。つまりはそういうことだ。
「どういうことですか?」
高崎くんが不思議そうに尋ねる。
「データ解析って簡単そうに見える。というか、仕組み自体は結構シンプルなものなんだよね」
僕が説明する、実はデータ解析に使われているアルゴリズムはそんなに複雑なものではないし、30年近い遥か昔に考えられたものだったりする。
「つまり誰でもできるってことですか?」
高崎くんが聞き返す。そう、簡単、複雑ではない仕組みということはそういうことだ。原理的には。
「そう、ほんとはね。でも実際はなかなかそうはならない」
僕が説明を続ける。一定の条件まで進めば簡単なものだ。物理の例題によくあった、空気抵抗はないものとする、みたいなことだ。
「どういうことですか?」
高崎くんが僕に問う。
「ノイズが入ってしまうんだね」
僕は説明する。いままでの簡単だという話の前提は、欲しいデータが欲しい形で手に入っている場合のことだ。しかし現実的にはそんなことはほとんど起こらない。
「ノイズ??」
高崎くんが聞き返す。ノイズという単語自体は聞いたことあると思うけれども、いろんな場所で使われすぎて把握するのが難しいのだろう。
「そう、データ解析自体は簡単。同じルールでデータが漏れなく集まっていればね」
僕が説明する。ここがデータサイエンスの肝になってくる問題なのだ。
「あー、足りないデータがあったりするとちゃんと動いてくれないってことですか」
高崎くんが核心をついた質問をした。
「そう」
僕が答える。まさにその通り。
「いい感じにやっておいてくれないんですか?」
高崎くんが微笑みながら僕に聞いた。
「いい質問だね」
そう、良い質問。データサイエンティストが必ず言われる言葉だった。
「あ、思い出しました!ものの角度がちょっと変わってるだけでコンピュータたには判別できないって」
彼女は僕らのチームに参加して時間はそんなに経っていなかったが、急速に学習をつづけていたのだった。
「そうその通り。ヒカルくんの技術は、たくさんのデータを集めて、同じルールで整理するという、めちゃくちゃ大事だけど難しい部分なんだ」
僕がヒカルちゃんの技術を簡単に説明した。




