2012-01-01から1年間の記事一覧

書籍紹介: Visual Object Recognition

Visual Object Recognition (Synthesis Lectures on Artificial Intelligence and Machine Learning)作者: Kristen Grauman,Bastian Leibe出版社/メーカー: Morgan & Claypool Publishers発売日: 2011/02/28メディア: ペーパーバック購入: 12人 クリック: 18…

Fine-grained visual categorization

一般物体認識は技術的興味の対象としては魅力的ですが、結局のところ何の役に立つのでしょうか?一般物体認識は、人間にとっていわば「常識」にあたるような基本概念の獲得を目指すものですが、常識であるがゆえに意外と使いどころがないのが実情かもしれま…

Sift on GPU

SiftGPUを動かしてみたのでメモ環境:CentOS6.0(64bit), GeForce9600GT CUDAインストール ここから、nvidiaドライバとCUDAのツールキットをダウンロードする。 http://developer.nvidia.com/cuda-toolkit-41 NVIDIA-Linux-x86_64-285.05.33.run cudatoolkit_…

Does Content Matter?

今日は、最近読んでいろいろ考えさせられた論文について紹介したいと思います。 Web-Scale Multimedia Analysis: Does Content Matter? IEEE MultiMedia. 18(2): 12–15 (2011) (pdf) http://www.slaney.org/malcolm/yahoo/VisionAndViews/Spring2011-DoesCon…

新型BoVW

いよいよ、従来のBoVWに変わる新しい特徴表現方法を見ていきます。これらの新しい特徴は直接線形手法に適用できるように設計されており、線形SVMと合わせて用いられることが多いです。 前置き 一枚の画像からBoVW(或いは、それに類する枠組み)によって特徴…

従来型BoVWの変換

Explicit feature map これに関してはどちらかというと識別器の工夫で、BoVWという表現そのものは何も変わりないのですがけっこう大事だと思うので。冒頭で述べたようにBoVWには非線形カーネルの利用が必要でした。もともとカーネルはunknownな高次元空間に…

次世代BoVWまとめ

以前のエントリでも述べましたが、bag of visual words(BoVW)は一般物体認識における標準的な画像特徴表現であり、非常によく用いられます。ですが、BoVWはこの3年ほどで急速に進歩しており、よく見られる「k-meansでクラスタリング → ヒストグラム作成 →…

大規模画像データセット

最近は画像認識・検索で用いられるデータセットも大規模化が進んでいます。 いくつか代表的なものや最近見つけたものをまとめてみます。 (ここでの目安は、教師つきデータは10万枚以上、教師なしデータは100万枚以上のもの) ImageNet http://www.image-net…

Paper Gestalt

明けましておめでとうございます。 お正月ということで、ちょっと変わった楽しい論文(?)を紹介したいと思います。 Carven von Bearnensquash, "Paper Gestalt", Secret Proceedings of Computer Vision and Pattern Recognition, 2010. http://vision.ucsd.…