部分データを作成する
さて、前回全ジャンルのデータをExcelで保存しましたが、これは大きすぎてあんまり取り扱いが便利でない。特定のジャンルや、特定の期間といった部分データを使用する場合、元データを絞り込んだデータを作って、それを使うのが便利です。つぎに、これを試みます。
ここでは、前回のエッセイと同様にエッセイジャンル、短編の情報のみ扱う事としましょう。
まずは、新規Excelファイルを開き、Jsonからの読み込みと同様、データ/データの取得/ファイルからを選びます。ただし、今度はExcelブックから、を選択します。
先に保存したファイルを選択すると、ナビゲーターが表示されるので、
テーブルである(アイコンの上に青線がある)narou1を選択します。すると内容がプレビューされます。
この後、データの変換ボタンを押すと、Power Queryエディタが立ち上がります。そこで、genre列でドロップダウンボタンを押して、項目9903のみを選択します。
同様に、novel_type列で2のみを選択します。最後に閉じて読み込む、をクリックするとエッセイの短編のみのデータが読み込まれます。データには「取得フィルタ」と「表示フィルタ」があり、表示フィルタはいつでも掛けられて変更でき、便利なのですが、データ自体を絞り込むことはできません。データを本当に絞り込むときには、クエリを修正して取得フィルタを構成する必要があります。
さて、以上の変更をすると、もともと60万行以上あったデータが2.5万行まで削減でき、Excelファイルとしても8MB程度までに小さくなりました。
実際に集計作業をする場合には、この新しく作成したファイルをデータソースにすることで、より軽量に解析が行えることになります。