講座概要

自然科学や社会科学を問わず、想定していたデータを当初の計画通り得ることは難しく、しばしばデータに欠測値が生じます。そのような欠測値に対処するためには、そのデータの背後にある欠測が生じる構造(欠測メカニズム)を理解し、適切に対処することが必要となります。本講義では、欠測が生じる構造(欠測メカニズム)を正しく理解し、その欠測値のタイプごとに古典的なものから最新の解析方法に関する解説を行います。

初めに欠測メカニズムについて解説を行い、欠測値のタイプ(MCAR, MAR, MNAR)を分類できるようにします。その後、欠測値のタイプごとに適切な解析方法の紹介を行います。特に、これまで応用上はあまり扱われてこなかった大規模データや MNAR (Missing Not At Random) における欠測値データに対する解析法の紹介や、Rによる実装・実演を行います。

実際のデータで生じ得る大規模データやMNARに対する欠測値データ解析法についても解説いたします。

  1. イントロダクション:欠測値の分類とその歴史的背景
  2. 代表的な欠測値への対処法:欠測値データに対する最尤法、多重代入法、重み付き推定法
  3. MARにおける解析法:逆確率重み付き推定量、二重頑健推定量
  4. MNARにおける解析法:擬似尤度法、キャリブレーション
  5. MCARにおける大規模欠測値データに対する解析法:スパース多変量回帰、CoCoLasso、HMLasso
  6. 演習:Rを用いた欠測値データ解析

【講義動画】前半: 70分、後半: 55分

【講義資料】1部、PDF

【演習資料】1部、R言語

このような方におすすめ

  • これまで欠測値を単純に削除したり、平均値で補完したりしていた方
  • 欠測メカニズムを考慮した適切な解析方法を選択したい方
  • 大規模データや複雑な欠測メカニズム (MNAR) に対応できる分析手法を習得したい方
  • Rを用いた欠測値データ解析の実装スキルを向上させたい方

受講によって期待できる効果

  • 欠測値のタイプ (MCAR, MAR, MNAR) を正しく理解し、分類できるようになる
  • 欠測値のタイプごとに適切な解析方法を選択できるようになる
  • 大規模データやMNARにおける欠測値データ解析法を習得できる
  • Rを用いた欠測値データ解析の実装スキルを向上させることができる
  • 実データに基づいたより高度なデータ分析を行うことができる

講師プロフィール

森川 耕輔 (もりかわ こうすけ)

アイオワ州立大学 統計学部 助教授

略歴

  • 2020年10月 - 現在大阪大学, 大学院基礎工学研究科 システム創成専攻 社会システム数理領域, 講師
  • 2018年5月 - 現在東京大学地震研究所, 巨大地震津波災害予測研究センター, 外来研究員
  • 2018年4月 - 2020年9月大阪大学, 大学院基礎工学研究科 システム創成専攻 数理科学領域, 助教
  • 2018年1月 - 2018年3月東京大学地震研究所, 巨大地震津波災害予測研究センター, 特任研究員
  • 2016年4月 - 2017年12月大阪大学, 大学院基礎工学研究科, 日本学術振興会特別研究員(DC2)

サンプル動画

講座の冒頭映像です

お申し込み

注意事項
  • セミナーの内容に関するご質問への対応は行なっておりません
  • ご購入後の返金は致しかねますので、ご了承ください
免責事項
  • 本ページの内容は予告なく変更する場合がございます
  • 主催者の諸般の事情や、天災地変その他の不可抗力の事態により、本講座の一部あるいは全部を中止させていただく場合がございます
お問い合わせ
  • ご質問やご不明点などがある方は、フッター部分にある「お問い合わせ」リンクよりご連絡くださいませ。