自作CNCマシン・レーザーカッターについて: Kaggle Digital Recognizer(MNIST): Keras, fit

2018年11月20日火曜日

Kaggle Digital Recognizer(MNIST): Keras, fit_generator() + hyperopt

Kaggle Digital Recognizer(MNIST)の続きです。前回から少しだけ内容を変えてみたらベストスコアがでました。
改良点は以下です。

fit_generator()：
前回は、通常の訓練model.fit()を使った後にData Augmentationとしてmodel.fit_generator()を追加して二段階で訓練しましたが、今回は最初からfit_generator()だけで訓練してみることにしました。

BatchNormalization：
CNNに関しては前回よりも層を少なくして、conv2dの後に必ずBatchNormalization()を入れ、プーリング層（学習なし）を使わずにstrides=2のconv2d()（学習あり）で1/2にダウンサンプリングすることにしました。

Hyperopt：
Hyperoptに関しては前回同様Dropout率だけを最適化しています（合計3箇所）。探索回数はとりあえず10回。

スコア：
結果はこれまでのベストスコアである0.99771（Top 5%）まで向上しました。
この辺りまで来るとスコアを0.001上げるのはかなり至難の技で、正直0.997以上になるとは期待していませんでした。しかし予想以上に満足できる結果が得られたので、Digital Decognizer(MNIST)に関してはひと段落ついたという感じです。

ただし、調べれば調べるほど興味深い項目が登場してきて、今後試してみたいのは：
・他のMNISTデータセットで今回のモデルの精度を確かめてみる（KaggleのMNISTデータセットにオーバーフィッティングしていないかどうかの検証）。
・今回はHyperoptによってDropout率を自動的に決定させましたが、Dropoutを一般化したDropconnectというのもあるらしく、それを使うとどうなるか（Keras Dropconnect Implementation）？

Kaggleで勝つデータ分析の技術

posted with amazlet at 19.11.04

門脇大輔阪田隆司保坂桂佑平松雄司
技術評論社
売り上げランキング: 363

Amazon.co.jpで詳細を見る

追記：
その後、既存のkeras.datasets.mnistのデータセット（60000+10000）で検証してみると0.997以上の正解率となりました。おそらくKaggleのMNISTデータも多数含まれているので似たような結果となったのだと思います（しかし偶然KaggleのMNISTデータだけにオーバーフィットしすぎているというわけでもなさそう）。

自作CNCマシン・レーザーカッターについて

2018年11月20日火曜日

Kaggle Digital Recognizer(MNIST): Keras, fit_generator() + hyperopt

0 件のコメント:

コメントを投稿

人気の投稿