今回は前回計算した結果でてきたthetaを用いての予測です。
ここが一番大事なはずなんですが、costfunctionとthetaを計算したら
満足している私がいました汗
本当はJを用いて最少誤差になる予測パラメーターθを導き出しているので、
予測を表現することが実務では大事なはずです。
今回は予測で2つ行います。
1つ目は問題文に書かれているこの部分です↓
導いたθを基に人口35,000人と70,000人の町ではいくらの
利益が出るか答えなさいということです。
四角で囲われている部分で[1,3.5]となっている3.5が35000人を示していると
思います。なぜならX,yのグラフを作った時にも人口はin 10,000というように
10,000で割った値を示されていたからです↓
利益も同じく10,000で割られているので、
結果に10,000をかけた数が利益予測になります。
結果です↓
人口35000人の場所のFood Truckの利益予測は4500$で
人口70000人の場所のFood Truckの利益予測は45300$ということです。
人口は2倍なのに利益は10倍と大きな差が出ました。
この予測がSampleと見比べて妥当なのかを見てみたいと思います。
そこで問題文にも書いてあった↓を行ってみたいと思います。
Sampleの分布に予測線を引くということは
予測が妥当かみるのに一番の手段だと思います。
(2次元の時しかグラフは作れませんけど)
予測線をいれるのはこういう式↓がはいってました。
(出典;『Coursera Machine Learning』 By Mr. Andrew Ng)
X(:、2)は↓のようにとってきているということですね。
X*thetaが予測値だから、それをY軸に表現しているということですね。
そうすると見事な予測線が得られました。
3.5の人口は写ってませんが、このグラフの目盛り1(=$10000)より
小さくなりそうです。$3000くらいになりそうですね。
7の人口は目盛り5近辺なので$45000も納得な感じです。
しかし疑問があります。
続いて本論とはずれますが、グラフ操作でhold on とhold offが
気になったので実験してみました。
やっぱりhold off機能については???が多いです。。。
予測線はかけたので今回はここまでにします。
また次回頑張ります!