Excelに読み込む
さて、Jsonデータが取得出来たら、次にこれをExcelに読み込みます。
なにぶん、データがGBサイズですので、32bit版のofficeではちょっと難しいです。その場合は、取り込み段階でデータを絞る必要があるでしょう(あらすじを削るのは効果がありそう)。ここでは、64bit版のofficeを前提とします。
Excelを起動し、データ/データの取得/JSONから
を選択し、ダウンロードしたファイルを選択します。しばらく時間がかかって、次のようなPower Queryエディターが立ち上がります。
次に、リボンのテーブルへの変換、を選択し、OKを押します。
すると、表示が変わるのでColumn1の右のボタンを押します。
しばらく以下の表示がなされますが
やがて次の表示に変わります。
「元の列名をプレフィックスとして…」のチェックを外し、OKを押します。すると時間がかかりますが、列の内容が展開されます。
次に、今後の処理のためにgeneral_firstup・general_lastup・novelupdated_at・updated_atの4つの日時列をctrlを押したまま選択することにより、複数選択します。ctrlを押したまま、いずれかのカラムのヘッダを右クリックしてメニューを出します。
メニューの中から型の変換を選択し、日付・時刻を選択します。これにより、各日時項目が日時型になるので年などの情報を取り出しやすくなります。
以上で手続きが済んだので、閉じて読み込む、をクリックすると、Power Queryのウィンドウが閉じられ、元のExcelで読み込みが始まります。新しくnarouタブが作成され、そこにデータが取り出されます。最終的には、次のようになります。
さて、読み込みが済んだので、ここで保存しておくのが良いでしょう。保存した結果は、約280MBのExcelファイルとなります。
なお、保存したExcelファイルはJsonファイルとのリンクが作成されているので、Jsonファイルを更新した後にExcelのテーブルデザインの更新、あるいはデータのすべて更新、を押すと新しいJsonファイルが再読み込みされます。