最後のOptionでNormal Equasionです。
Videoでは
(出典;『Coursera Machine Learning』 By Mr. Andrew Ng)
と説明されていて、
nが大きいと時間かかるけど、nが小さかったら一発で解答にたどり着くというイメージなのでとても楽しみにしていました。
まずは問題文を読んでみます。
Normal Equationの場合はfeatureNormalizeしなくていいと書いてあります。
収束するまでのLoopはないと書いてあります。
(一発で解答がでるからと理解してます)
Xにすべて1の列を足すのは同じとかいてあります。
さて問題のプログラミングの式ですがVideoで↓のように案内されていました。
式の意味は分かりませんが、
ベクトルの次元としては
3X 47かける47X3で3X3になって
3X3 かける 3X47で3X47になって、
3X47 かける 47X1で3X1の次元になるように見えますね。
とにもかくにも、この式で計算するとthetaが↓のように出ます。
Normal Equationで計算されたthetaでJを計算すると、
20億4千万くらいですね。
Α=.0.01 itetation=1500でやった計算も
Jは20億4千万くらいでした。
1500回やればある程度は収束するということなのかもしれません。
Food Truckの問題もNormal Equationでやってみたいと思います。
Food Truckをalphaを使いながら収束させたときの解の復習です。
4.4799から4.477へと
収束しています
そのときのthetaは↓でした。
これをNormal Equationで行った結果と見比べてみます↓
Jは4.477で同じです。
thetaはわずかに違います。
Food Truckをα,iterationをやった時には
完全最適なのか不完全最適なのかわかりませんでしたが、
Normal Equationでほぼほぼ完全最適に
収束していたことが裏付けられたと思いました。
今回はここまでです。
次回から他のWeekからWeek2の課題をみて
試せるテクニックは試してみたいと思います。