画像サイズと認識率

GISTは比較的計算コストが小さい特徴量ですが、やはりそれなりに時間がかかります。手っ取り早く処理を軽くするには画像サイズを小さくすることが考えられますが、認識精度との兼ね合いが気になるので調べてみます。

ベンチマークは、前回と同じMITのシーン画像データセットを用います。1クラスあたり100サンプルの学習画像をランダムに選び、認識率を算出します。これを10回繰り返し平均をとります。識別器はSVMを用いました。
結果は以下のとおりです。

画像サイズ 32x32 64x64 128x128 192x192 256x256
認識率(%) 76.1 79.8 81.5 81.0 80.4

ということで、128x128が最もよい結果となりました。一般的なサムネイル画像くらいの大きさがあればOKなようです。もちろんデータの性質にもよりますが、あまり大きすぎると逆に良くないようです。