暇人日記

アラフォーおっさんのコーセラの機械学習の課題を解こうと頑張っています!

Coursera Machine Learning Week4 課題 2周目① -苦闘記憶-  データセットの確認

Week4の課題は0-9の手書きの数字を機械学習させて認識させる課題でした。

これをMulti-Class classificationとNeural Networkの2つの方法で解くという設定でした。

 

Neural Networkをついにプログラミングできるという喜びとやりがいのある

課題だったのを覚えています。

 

それでは、まずDatasetをみてみます↓

f:id:omoshiroamericanews:20200201231157p:plain

5000X400!!

 

Week2やWeek3の課題ではSample数は50-100個でしたので

圧倒的に増えました。

 

5000のTraining Exampleで400は20X20の正方形のデータということです。

 

f:id:omoshiroamericanews:20200224184228p:plain

f:id:omoshiroamericanews:20200224184243p:plain

 

絵にするとこういう感じですね↓

f:id:omoshiroamericanews:20200224184539p:plain

 

Neural Networkをやれるんだ!という気がしてきます。

 

問題文を読み進めていきます。

 

f:id:omoshiroamericanews:20200224184806p:plain


 5000のSampleのうち、100をランダムに取り出してVisualizeするという説明です。

f:id:omoshiroamericanews:20200224185014p:plain

 

1行が1つのSampleなので100行取り出すと

100個のSampleを取り出すことになるはずです。

 

f:id:omoshiroamericanews:20200224185305p:plain


 だから、プログラム実行後のFigure1も10X10で100個のSampleになっていると

思います。

 

それではプログラム全体ex3.mをみてみます。

f:id:omoshiroamericanews:20200224185912p:plain

赤で囲った部分で100行を取り出していて、それをselとしているようです。

selは100X400のベクトルだと思います。

 

f:id:omoshiroamericanews:20200224191115p:plain

やはりそうでした。

生データを見てみました↓

 

f:id:omoshiroamericanews:20200224191152p:plain

みてもよくわかりませんでした。。。

 

displayData(sel)でDataを表示しているので、displayData.mを

見てみましたが複雑すぎてわからないので飛ばします。

機械学習そのものではなくDataの表示の仕方なのも飛ばす理由の1つです。

 

今回はここまでです。また次回頑張ります!