11
① ビッグデータとは
従来のDBでは扱えないほど巨大・複雑なデータ。
特徴は 3V / 4V / 5V
Volume(量)
Variety(多様性)
Velocity(速度)
+ Veracity(正確性)
+ Value(価値)
IoT・SNS・スマホ・ウェアラブル端末などから大量に発生。
AIによる分析が進み、社会や産業での活用が重要。
② ビッグデータの分類(総務省)
政府:オープンデータ
→ 国・自治体の公共データ(開示・利活用)
企業:知のデジタル化
→ ノウハウ・暗黙知のデータ化
企業:M2Mデータ (Machine to Machine)
→ 機械と機械がやり取りするデータ
個人:パーソナルデータ
→ 行動履歴・属性・ウェアラブル情報
→ 匿名加工情報も含む
③ ビッグデータの活用方法
オープンデータ
→ 行政の透明化、防災、公共サービス
産業データ
→ 生産性向上、コスト削減、予兆検知、ヘルスケア
パーソナルデータ
→ マーケティング、サービス最適化(本人同意が前提)
④ ビッグデータの分析方法
クロス集計分析
→ 条件別に集計(年代別・曜日別など)
アソシエーション分析
→ 同時に起こりやすい関係を見つける
(例:ビールと紙おむつ)
ロジスティック回帰分析
→ YES/NOの確率予測
クラスタ分析
→ 似たもの同士をグループ化
デシジョンツリー分析
→ 条件分岐で予測・分類(決定木)
超短暗記まとめ
ビッグデータ → 大量・多様・高速
オープンデータ → 行政
M2M → モノ×モノ
パーソナル → 個人情報
分析
クロス集計=条件別
アソシエーション=一緒に起きる
クラスタ=仲間分け
デシジョンツリー=分岐判断
【第1問】
ビッグデータの特徴を表す3Vとして正しい組み合わせはどれか。
A. Volume・Value・Vision
B. Volume・Variety・Velocity
C. Variety・Veracity・Value
D. Velocity・Vision・Value
【第2問】
次のうち、ビッグデータに含まれるデータの例として最も適切なものはどれか。
A. 紙の帳簿だけの売上記録
B. IoTセンサーから取得されるリアルタイムデータ
C. 年1回集計される手作業の表
D. 個人の記憶だけに頼る情報
【第3問】
総務省の分類で、国や自治体が公開する公共データを何というか。
A. 産業データ
B. パーソナルデータ
C. オープンデータ
D. M2Mデータ
【第4問】
M2Mデータの説明として正しいものはどれか。
A. 人が入力するアンケート結果
B. 企業のノウハウ文書
C. 機械同士がネットワークでやり取りするデータ
D. 匿名加工された個人情報
【第5問】
パーソナルデータを企業が活用する際に、重要な前提条件はどれか。
A. 企業の判断だけで自由に使える
B. 個人の同意を得る
C. 国の承認のみで利用できる
D. 必ず匿名化しなくてよい
【第6問】
売上を年代別・曜日別に分けて分析する手法はどれか。
A. クラスタ分析
B. アソシエーション分析
C. クロス集計分析
D. デシジョンツリー分析
【第7問】
「ビールと紙おむつが同時に購入されやすい」
この関係を見つける分析手法はどれか。
A. クロス集計分析
B. アソシエーション分析
C. ロジスティック回帰分析
D. クラスタ分析
【第8問】
YES/NOのような2値の発生確率を予測する手法はどれか。
A. クラスタ分析
B. ロジスティック回帰分析
C. クロス集計分析
D. デシジョンツリー分析
【第9問】
顧客を嗜好が似ているグループに分けたいときに使う手法はどれか。
A. クラスタ分析
B. アソシエーション分析
C. クロス集計分析
D. ロジスティック回帰分析
【第10問】
「もし◯◯なら△△」という条件分岐で予測・分類する手法はどれか。
A. クロス集計分析
B. クラスタ分析
C. デシジョンツリー分析
D. アソシエーション分析




