第10話 ゲノムの表
ディスプレイに無数の光点を表示する白く冷たい筐体が目の前にあった。満天の星空を映す天体写真の如き画像が30秒ごとに更新されている。光点の色は赤、青、緑、黄の四色。更新ごとに光の位置は変わらず、その色だけが変化している。ある点は赤から青へ、ある点は黄色から赤へ、そしてある点は赤から赤。
学会で見た蛍光顕微鏡下の培養細胞の核に似たその光景は、事前に沙耶香から受けた説明のままだった。生命の設計図であるDNAを解析するこの機械は、蛍光の撮影装置であるという意味であの顕微鏡と変わらないのだ。
DNAはATCGの四種類の塩基が繋がった分子だ。四種類の文字でつづられた30億文字の本だといえる。本を読む直線的なイメージと、膨大な数の光点が色を変える画像はそのイメージが一致しない。
だが、この膨大な光点一つ一つがDNA配列を現す。光点一つ一つが一本のDNA断片に対応し、赤、青、緑、黄の四色はそれぞれA、T、G、Cの塩基の種類を示している。
血球から取りだされたゲノムDNAは、1000塩基程度になるようにランダムに裁断される。その大量のDNA断片をカバーグラス程度の板の上に流す。板にはDNA断片の端がくっ付くような化学処理がされており、大量のDNA断片がシリコン上にランダムに並ぶことになる。
海中のワカメのように、板の上にDNA断片がバラバラに生えているイメージだ。その数はスライドグラス程度の範囲になんと百万本。その一本一本に対して、赤、青、緑、黄の蛍光色素でマークした塩基を合成していくのだ。DNAはAはTと、CはGと結合するので、元のDNAは相補的な色の塩基が結合する。
一サイクルにつき、一塩基ずつ合成される結果を写真撮影する。目の前の三十秒ごとに更新される画像の光点がそれだ。一つのDNA断片から一分間に二文字読めるということは、人間の全ゲノムである30億を読み終わるのに2,500万時間かかることになる。
だがそれは光点が一つだったらの話だ。画像処理という方法を使うことで、百万の光点《DNA》が同時並行で解析される。百万個の断片が規則正しく並ぶ必要はない。百万個の光点一つ一つの位置を認識し、その色の変化を記録していくのは現代のコンピュータには造作もない作業だ。
結果として、解読能力は百万個のDNA断片から30秒ごとに一文字、つまり一分間に200万塩基になる。30億塩基は理論上2.5時間で解読が終わるのだ。
最初にヒトゲノムを解読された時には12年の時間と30億ドルの費用が掛かった国家事業だった。それが今や一日で終わり、費用は数万円だ。
「最近の生物学はビックデータ解析そのものなんです」といった沙耶香の言葉がやっと少しだけ実感できた。
感心している場合じゃなかったな。密偵としての役割を実行しなければならない。機械の横にあるコンピュータに近づく。遠心分離機を修理した工具で基盤のカバーを外し、ルルから送られてきたチップを差し込む。
途端に画面に黄色い狐のロゴが浮かんだ。
『データの入手成功。データベース形式を解析…………。データセット数は103。財団が集めたVA選手のゲノムデータで間違いないね』
(当たりだな。内容はどうなっている)
『ゲノムデータの分析結果らしきデータ系列がある。おそらく今回のプロジェクトにおけるスコアだろうね。ただ算出方法が分からないとスコアの解読はできない』
(一人当たり三十億文字のデータをどうやって解析するんだ)
『私に任せてください。分析されたデータに『Xp21.3』が存在します。これは染色体地図を現す記号で『X染色体の短腕の真ん中付近』を指します』
テックグラスに染色体が表示された。二十三本の染色体の最後、その短い腕の一部が拡大表示される。単線鉄道の路線図のように遺伝子が並ぶ。『stu2321』という名前がピックアップされた。
『配列からこの遺伝子について行われた研究リストを呼び出し。……ほとんどありませんね。なるほど分かりました、DNA配列上は遺伝子としての構造を持っていても実際には働いていない、偽遺伝子と言われるものです。ゲノム上に数千存在する偽遺伝子の一つです。『解析をシミュレーションに移行します。まずはこの配列からタンパク質へと翻訳、立体構造を……』
(なるべく急いでくれ。上がいつまでも大人しくしててくれるとは限らない)
ハッキングから分析までのスピードに目を回しそうだ。こうなると俺の出番はないな。俺は【ソナー】によるモデルの監視に集中する。本体であるモデル、八須長司は自分の部屋を中心に三階を定期的に巡回している。彼から伸びるDPの蜘蛛の糸はXomeの建物の周辺を飛ぶドローンを操っている。
これまで行動パターンは変わらない、俺の侵入に気が付いている痕跡はゼロだ。
『わかりました。この遺伝子はVoltの中央部、つまりNSDと似たタンパク質をコードしています。相同性は71パーセントです』
『逆に言えば三割も違うんだよね。同じ機能と言えるのかい?』
『アミノ酸の性質も考慮すれば近似性はさらに上がります。生物学的には同じものと判断します。もちろんニューロトリオンやディープフォトンといった超物理学的には分かりませんが、財団が着目している以上、タンパク質レベルの実験は終わっているのだと考えます』
『なるほど、財団は前回の学会でNSDの配列情報を得ている。NSDタンパクを合成してディープ・フォトンに反応することをタワーで実験して確かめたんだろう。stu2321に対しても同じことはできる。だけど人間の脳の中で、それも十五歳を超えて意識を発達させた人間の脳の中での働きは分からない。そこで最適の実験動物を探し始めたわけだ』
『……倫理的な問題を除外すれば最も効率のいい研究方法です』
大勢の人間の中から、自分たちが調べたい遺伝子の実験対象として優れた人間を探す。人間のために実験するんじゃなくて、実験のために人間を探す。そして、データだけでこんなことが出来る網羅的解析の力だ。ぞっとする話だ。
(だけど、じゃあなんでVA選手に目を付けた。今の話だとどの人間にもstu2321は存在しているんじゃないのか)
上の監視を続けながら気になったことを聞く。
『stu2321は偽遺伝子です。多くの人間では実際には働いていません。財団が調べているのは遺伝子そのものよりもこの遺伝子の発現制御にかかわるSNPsですね。おそらくVA選手の資質と関係するSNPsです』
(スニップス?)
『Single nucleotide Polymorphism、一塩基多型です。人間の遺伝子は99.9パーセント共通です。逆に言えば千塩基に一つの割合で違いがあります。この違いが個人差を生んでいます。有名なSNPはアルコールを分解する酵素を作る遺伝子のSNPです。一塩基の差でお酒の強さが決まります』
そう言えば人間とサルの違いは僅か3パーセントだったか。それを考えれば俺みたいな普通の人間と、今頭の中でフレーバーテキストでやり取りしている二人みたいなのの差が0.1パーセントで生まれてもおかしくないか。少なくとも言葉は通じるらしいからな。
上のパターンが変わった、外のドローンの範囲が狭まっている。
『stu2321の遺伝子本体ではなくスイッチ部分の配列や、そのスイッチに結合する転写因子に関係するSNPsです。本来スイッチが入らないstu2321を発現する人間が存在します、特にVA選手、正確に言えばVA選手になれるような身体能力と瞬発的な思考能力と関わるのでしょう』
『立体知性の要件に近いというわけだね。OK、これでスコアの意味が分かった。複数のSNPの組み合わせでランク分けされている』
『あの……』
(古城舞奈のスコアはどうなっている?)
『中の上程度だね。最終候補には残らないだろう。DPCを埋め込むまでやるなら対象は選別する』
(仕事は終わりだな。古城舞奈がターゲットにならないなら深入りするメリットはない)
『よかった』という沙耶香のつぶやきが聞こえた。これは予定通りの方針だ。
古城舞奈が財団のプロジェクトの有力候補なら彼女と関係がある俺たちの安全にかかわる。逆にそうでないなら下手な干渉は危険性が増す。例えば万が一俺たちの情報が漏れたら、逆に古城舞奈が再注目される。向こうからは古城舞奈が俺たちの一員に見えるだろう。逆もまたしかり、つまり藪蛇だ。
『わかっているよ。今回のことでstu2321のデータが得られた。沙耶香なら時間をかければもっと情報が引き出せるよね』
『NSDやstu2321の中でDPやNTに反応するコアの領域や、その量子化学的な性質についても分析できます』
テックグラスに多くのグラフや数式、そして立体構造が現れた。考えてみれば今回の『探索』もあり得ないほどの高難易度だった。だが、データ入手から15分でここまで出来た。前回の学会とは大違いだ。
後は脱出するだけ。上のモデルの行動は相変わらず変化なし、三階の巡回と建物周囲のドローンによる警戒。こちらの侵入には気が付いていない。当然だ、向こうが警戒しているのはDPCであってルールブックじゃない。
本当に当然か? 財団のプロジェクト、ここの設備、そしてモデルの能力、そしてここまでのやつの動き。
突如違和感を覚えた。俺の頭の中に構築された敵のキャラクターの取るべき行動が現実のそれと一致しない。