【筑波大学】オープンコースウエア　機械学習

はやたすさんおすすめの、「筑波大学　オープンコースウエア　機械学習」で勉強を始めました。
簡単に、覚えておきたいメモを残していこうと思います。

ocw.tsukuba.ac.jp

機械学習 | 筑波大学オープンコースウェア｜TSUKUBA OCW

こちら、大学の授業を無料で、しかも分からないところは何度でも学習できるので、機械学習を学習したい方におすすめです！

なお、pythonプログラミングから勉強したい方は、はやたすさんのYoutubeがおすすめ！
nikonikostudy.hatenablog.jp

第1回　機械学習概論と単回帰（1）
第2回　機械学習概論と単回帰（2）
- 目標値と特徴量
- データの確認
- データの前処理
第3回　重回帰 (1)
第4回　重回帰 (2)
第5回　モデルの複雑さと汎化 (1)
第6回　モデルの複雑さと汎化 (2)
第7回　特徴選択とL1正則化 (1)
第8回　特徴選択とL1正則化 (2)
第9回　決定的識別モデル (1)
第10回　決定的識別モデル (2)
第11回　カーネル/確率的識別モデル1 (1)
第12回　カーネル/確率的識別モデル1 (2)
第13回　確率的識別モデル2/経験損失最小化 (1)
第14回　確率的識別モデル2/経験損失最小化 (2)
第15回　k-meansと主成分分析(1)
第16回　k-meansと主成分分析(2)
第17回　ニューラルネットワーク1 基礎とCNN (1)
第18回　ニューラルネットワーク1 基礎とCNN (2)
第19回　ニューラルネットワーク2 RNNとGAN (1)
第20回　ニューラルネットワーク2 RNNとGAN (2)

第1回　機械学習概論と単回帰（1）

第一回学習：2021/06/10

「簡単に知れること」から「簡単には知れないこと（コストがかかること）」を予測する

第2回　機械学習概論と単回帰（2）

第一回学習：2021/06/10

目標値と特徴量

目標値：予測したい値
– 目的に沿って自ずと決まる場合が多い
– 取得にコストがかかる値である場合が多い

特徴量：目標値䛾予測と関係する(と考えられる)値
– どんなデータが優秀な特徴量か䛿普通明らかでない（よい特徴量䛿よい予測精度につながる）
– 取得にコストがかからない値を選びたい（取得にコストがかかる目標値を回帰を使って安価に得たい）
– 優秀で安価に得られる特徴量を見つけることがなにより重要

データの確認

データがどんな分布をしているのか、ざっと可視化してみてみる（ヒストグラムなど）
アルゴリズムに突っ込めば当たる、って思いがち
ゴミを突っ込んでもゴミしか出てこない。
全体の労働時間の5%くらい。データ集めて、データきれいにして、特徴量設定するのがとっても大変

データの前処理

・欠損値へ䛾対応
– 欠損値を含むサンプル䛿除去する
– 欠損値䛿そ䛾特徴䛾平均値・中間値で補完する
• 外れ値へ䛾対応
– 全体を俯瞰し、極端な外れ値を含むサンプル䛿除去
する(測定エラー、入力ミス、例外䛾可能性)
• スケーリング
– 各特徴が平均0、標準偏差1になるようスケーリング
– 最大値が0、最小値が1になるようスケーリング

◆要復習◆
微分

第3回　重回帰 (1)

第一回学習：2021/06/10

スケーリングしたものでないと、最も正・負の影響が強い特徴量を評価することはできない

第4回　重回帰 (2)

第一回学習：2021/06/10

第5回　モデルの複雑さと汎化 (1)

第一回学習：2021/06/11

◆要復習◆
線形代数（行列計算）
M次多項式回帰モデル　よくわからない
確率統計

第6回　モデルの複雑さと汎化 (2)

第一回学習：2021/06/11

どういうデータがあるのかお客さんがわかってないことは多い。
どういうものが欲しいか、お客さんがわかってないことも多い。

◆要復習◆

第7回　特徴選択とL1正則化 (1)

第一回学習：2021/06/12

◆要復習◆

第8回　特徴選択とL1正則化 (2)

第一回学習：2021/06/15

◆要復習◆
LassoとRidgeがちゃんとわかっていない

第9回　決定的識別モデル (1)

第一回学習：2021/06/15

◆要復習◆

第10回　決定的識別モデル (2)

第一回学習：2021/06/15

第11回　カーネル/確率的識別モデル1 (1)

第一回学習：2021/06/16

第12回　カーネル/確率的識別モデル1 (2)

第一回学習：2021/06/16

ゆるゆるチャレンジ

興味のあることをゆるゆる共有します〜

【筑波大学】オープンコースウエア　機械学習

第1回　機械学習概論と単回帰（1）

第2回　機械学習概論と単回帰（2）

目標値と特徴量

データの確認

データの前処理

第3回　重回帰 (1)

第4回　重回帰 (2)

第5回　モデルの複雑さと汎化 (1)

第6回　モデルの複雑さと汎化 (2)

第7回　特徴選択とL1正則化 (1)

第8回　特徴選択とL1正則化 (2)

第9回　決定的識別モデル (1)

第10回　決定的識別モデル (2)

第11回　カーネル/確率的識別モデル1 (1)

第12回　カーネル/確率的識別モデル1 (2)

第13回　確率的識別モデル2/経験損失最小化 (1)

第14回　確率的識別モデル2/経験損失最小化 (2)

第15回　k-meansと主成分分析(1)

第16回　k-meansと主成分分析(2)

第17回　ニューラルネットワーク1 基礎とCNN (1)

第18回　ニューラルネットワーク1 基礎とCNN (2)

第19回　ニューラルネットワーク2 RNNとGAN (1)

第20回　ニューラルネットワーク2 RNNとGAN (2)

第1回 機械学習概論と単回帰（1）

第2回 機械学習概論と単回帰（2）

目標値と特徴量

データの確認

データの前処理

第3回 重回帰 (1)

第4回 重回帰 (2)

第5回 モデルの複雑さと汎化 (1)

第6回 モデルの複雑さと汎化 (2)

第7回 特徴選択とL1正則化 (1)

第8回 特徴選択とL1正則化 (2)

第9回 決定的識別モデル (1)

第10回 決定的識別モデル (2)

第11回 カーネル/確率的識別モデル1 (1)

第12回 カーネル/確率的識別モデル1 (2)

第13回 確率的識別モデル2/経験損失最小化 (1)

第14回 確率的識別モデル2/経験損失最小化 (2)

第15回 k-meansと主成分分析(1)

第16回 k-meansと主成分分析(2)

第17回 ニューラルネットワーク1 基礎とCNN (1)

第18回 ニューラルネットワーク1 基礎とCNN (2)

第19回 ニューラルネットワーク2 RNNとGAN (1)

第20回 ニューラルネットワーク2 RNNとGAN (2)

第1回　機械学習概論と単回帰（1）

第2回　機械学習概論と単回帰（2）

第3回　重回帰 (1)

第4回　重回帰 (2)

第5回　モデルの複雑さと汎化 (1)

第6回　モデルの複雑さと汎化 (2)

第7回　特徴選択とL1正則化 (1)

第8回　特徴選択とL1正則化 (2)

第9回　決定的識別モデル (1)

第10回　決定的識別モデル (2)

第11回　カーネル/確率的識別モデル1 (1)

第12回　カーネル/確率的識別モデル1 (2)

第13回　確率的識別モデル2/経験損失最小化 (1)

第14回　確率的識別モデル2/経験損失最小化 (2)

第15回　k-meansと主成分分析(1)

第16回　k-meansと主成分分析(2)

第17回　ニューラルネットワーク1 基礎とCNN (1)

第18回　ニューラルネットワーク1 基礎とCNN (2)

第19回　ニューラルネットワーク2 RNNとGAN (1)

第20回　ニューラルネットワーク2 RNNとGAN (2)