企画名

理学におけるデータ科学実践:機械学習で自然科学を読み解けるか

参加教員

教員名 所属 職名
中野 直人(代表教員) 理学研究科 連携講師
余田成男 地球惑星科学専攻 教授
その他調整中    

企画の概要

実験や観測からデータを取得してそれを解析することは,自然科学のいずれの分野においても普遍的に必要とされることである.昨今は機械学習などのデータ科学的手法が発達し,計算機能力の向上に伴い,様々な目的でデータが潜在的に持つ情報の抽出が試みられている.しかし,実際の理学研究においてもこれらの手法はどこまで有効なのであろうか.本SGでは,データ科学的手法を簡単なものから習得して,データ科学を身近なものにすることを目的とする.さらに,既存手法との比較による再確認,既存手法では得られない新たな理解,ここで学ぶ新しい手法ではできないこと,手法の数学的構造,などを整理することで,各手法の本質の理解を目指す.

 

具体的なSGの進め方としては,まず各手法の大まかなサーベイを行ってデータ科学を俯瞰した後,サンプルデータで手法に慣れるようにする.その後は,個人もしくはグループで課題を設定して進めることとする.設定課題は,自身の研究室の課題に必ずしも限定しない.Kaggle等のデータサイエンスコンペティションへの参加もその範疇に含めて良い.ミーティングは月に1・2回程度開くこととし,その場では新しい手法の習得やそれぞれの設定課題の進捗状況を報告して,SG全体で共有することとする.

 

本SGでは機械学習の手法に主眼をおくため,主にPythonを用いて実習を行うが,ミーティングの初回にチュートリアルを行うなど,計算環境の準備も行う.実習を進めるにあたっては,プログラミングスキルや機械学習の経験差によって,活動内容や興味対象の幅に差が出やすいため,経験者がTAとして参加するようであれば,2018年度のSG11のコンテンツを用いた初心者用速習コースも設置可能である.

実施期間・頻度

月1・2回(最初は集中的に導入的講義を行う)

 

TA雇用の有無

 

その他、特記事項など

参加人数によってはミーティング場所の確保に困る場合があります

 

問い合わせ先

中野 直人 n_nakano*math.kyoto-u.ac.jp
(*を@に変えてください)
 

スタディグループへの登録は締め切りました。
関心のある方は macs *sci.kyoto-u.ac.jp(*を@に変えてください)までご連絡ください。

 

SG担当教員(中野)から既に第1回ミーティングについて連絡をしています。 ページ末尾にあるアドレスからのメールを受信できるようにしてください。 まだ連絡を受け取っていない場合は至急連絡すること。


図1: Reservoir Computingの概念図



 

図2: 機械学習で岩石のX線3次元CT画像の輪郭抽出をしている様子

 
 


 

報告会資料ダウンロード(4.7MB)

活動報告

活動目的・内容

【活動目的】実験や観測で得られるデータの解析は,自然科学のどの分野においても必要である.データの潜在情報を抽出するために機械学習的手法が広い分野で使われており,手法の習熟は近年の重要事項と言って良い.本SGでは各手法の習得を目指し,それぞれの分野における機械学習などのデータ科学的手法の適用可能性を探索した.既存手法との比較検討や手法の理論的考察を含め,包括的に整理することが目的である.
 

【内容】本SGでは前期期間は5回の会合で手法を学習した.人数は各回5〜10人ほど,場所は理学研究科1号館335室(MACSプロジェクトスペース)を利用した.演習内容としては,言語はPython,開発環境はJupyter Notebook を用いた.さらにTAにデータ科学教材の作成補助を依頼,教材整備を行った.後期期間はTAとして雇用した院生2名の活動を中心に,それぞれのテーマでのデータ科学的手法の学習と研究を行った.
 

活動成果・自己評価

【活動成果】参加者の簡便性を重視し,SGミーティングは代表教員が準備したサンプルプログラムをなぞる形で実施した.内容としては,機械学習手法ライブラリである scikit-learn を用いて,多層パーセプトロン(MLP),決定木等の一通りの解析手法を習得し,附属地磁気世界資料解析センター提供の気象庁柿岡地磁気観測所のデータからのパターン抽出を試した.また,TAは基礎的な統計解析のR Studioで用いる教材の整備を行った.TAによる研究活動は(1)PythonによってReservoir の実装と「なぜ学習がうまくいくか」を探るための解析 (2)MATLABを用いて,画像解析手法を習得し,自身の研究に関連する鉱物画像を題材に輪郭抽出手法の実装とテストを教員の指導の下で行った.
 

【自己評価】登録学生の所属専攻や系は数学,物理,地球物理,化学と幅広く,データ科学的手法のニーズは顕となった.今年度はTAとして主体的に学習・研究を進める修士の学生が2名おり,SGを運営する上で良い起爆剤となった.いずれのTAの取り組んだテーマも自身の専門とは異なったが,TAが自走して取り組んでおり,彼らを素直に褒めたい.代表教員としても大いに刺激を受けた.昨年度はボトムアップに注力したために基礎的内容に留まって学生の興味を伸ばせなかったが,今年度は逆にTAとして主体的に動いてくれた学生に集中したため他の参加者に対して取りこぼしがあったことは残念に思っている.SG実施時におけるバランスについては今後改善していきたい.
 

参加メンバー

氏名 所属 職名・学年
中野 直人(代表教員) 理学研究科 連携講師
余田 成男 地球惑星科学専攻 教授
宮崎真一 地球惑星科学専攻 准教授
塩崎 謙 物理学・宇宙物理学専攻 助教
大熊 信之 その他(理学研究科以外など) 学術振興会特別研究員(PD)
山際 宏明 数学・数理解析専攻 B5
大岡 明徳 物理学・宇宙物理学専攻 M1
金子 博人 生物科学専攻 D1
伴 広輝 生物科学専攻 M1
王 鵬皓 数学・数理解析専攻 D1
西 瑞穂 地球惑星科学専攻 M2
間仁田 侑典 物理学・宇宙物理学専攻 M1
前田 玉青 生物科学専攻 M2
佐藤 慶暉 その他(理学研究科以外など) B2
原 誠人 数学・数理解析専攻 M1
金子博人 生物科学専攻 D1
藤津 尚仁 その他(理学研究科以外など) B1
李 耀漢 化学専攻 研究生
原 将太 地球惑星科学専攻 M2
梅本滉嗣 物理学・宇宙物理学専攻 D2
須田沙織 物理学・宇宙物理学専攻 D2
佐々木 裕文 数学・数理解析専攻 D2
福田 悠登 数学・数理解析専攻 M1
林 大寿 物理学・宇宙物理学専攻 M1
春名 純一 物理学・宇宙物理学専攻 M2
糀谷 暁 化学専攻 M1
澤崎 義仁 理学部 B3