« 席を譲る | トップページ | 考え中 »

画像で検索

正確には、画像で検索。
これって何? と思われるものを写真にとって検索する。という代物。

というものを妄想してみた。


ことの始まりは、類似画像検索というものがある。
という事を知ったあたりから始まり、

え~ ってことは、

二つの画像の類似性が分かるってことだ、

じゃあ片方の画像に、これはなんなのか?
つまり何の画像なのか、っていうタグを付けてやれば、

写真で撮ったものがなんなのか?が分かる。
っていう検索エンジンが出来るんじゃね?
いや、まあ、そんなに正確には分からないだろうけど、
大体、なんとなく、それが何なのか、が分かれば使えるんじゃない?

と、妄想したところから始まる。


そして今日まで調べて見たものを、記録してみる。

類似画像検索に関する情報 http://homepage3.nifty.com/TaN/prog-image.html
類似画像エンジンを探しています。という方がまとめたページ。 色々ざっくりと載っている。 ここにある、imgseekというソフトから、isk-daemonというサーバサイドのプログラムを見つける。
isk-daemon: Content-based image database server http://server.imgseek.net/
isk-daemonの本サイト。 しかし英語。 途中のバージョンからオープンソースらしい。いい感じだ。
isk-daemonを使ってみる http://d.hatena.ne.jp/nullpobug/20080210/1202642369
linuxにインストールして動作させてみるまでが書いてある。 言語はpythonを使用しているみたい。 そもそもisk-daemon自体もpythonで書かれているみたい。
Perl で作る画像類似検索システムの考察 http://www.drk7.jp/MT/archives/001258.html
実際にperlで作った人がいた。 perlにはimgseekのパッケージがあるらしい。羨ましい。phpはないのか?



TinEye Image Search
http://tineye.com/login

海外で、似たようなサービスを発見。
これは単純に類似画像を検索するだけらしい。
アカウントが必要。
試してみた感想。
かなり正確に類似画像を探してくる。故に変な画像をアップすると、結果0が連発する。
六本木ヒルズに行った時に撮った、蜘蛛のオブジェみたいなやつをアップしたら、
見事に当てて見せた。ビックリした。

gazopa http://www.gazopa.com/sign_in
日本発の類似画像検索らしい。 まだ試していない。
類似画像を見つけてくれる日本発画像検索エンジンGazopaを試してみた http://written.4403.biz/archives/2008/09/gazopa.html
試した人、発見。 ついでに似たようなことを考えているっぽい。 というか要求している。ニーズがあるってことだよね。


その他にも色々見つけました。
この辺の技術を使って遊んでみている人。
大手企業が似たようなものを開発して売っていたり。
特定のカテゴリに置いては、、僕の言っている画像検索があった。
例えば、ワインのラベルを検索したり、花木を検索したり。
これはつまり、カテゴリを特定させなければ実現は難しい。ということなんだろうか?
ちなみにさらさら検索しているときに見つけたものなので、
試していないし、どこにあったのかも忘れた。
そもそも公開されていないのかもしれない。

さらに妄想する。
二つぐらい課題が見つかる。
検索される側の片方の画像、そしてタギング。このデータベースをどうやって構築するか。
物、場所、全部って言ったらアホみたいな数字になりそう。
軽く探してみたけど、使えそうなソースが無い。
タギングされている画像はいっぱいあるんだけど、そのタグがそのものを指している場合が少ない。
状況とか前後関係からタグが付けられている場合も多く、画像で検索のタグとしては使えない。
一番使えそう、と思ったのが、今ある画像検索、例えばgoogleの画像検索とか、
キーワードを入れると関連してそうな画像が出てくる。そのキーワードこそタグに使えそうだ。
っでこのキーワードをどこから持ってくるのか?
ん~ 人力ですかね? それじゃソリューションとは言えないですかね?
そして二つ目の課題。
まあ、なんとかデータベースは出来たと仮定して、
使い勝手を良くする為には、そりゃもう膨大なデータが必要だ。
そしてデータが膨大になれば、検索スピードは極端に落ちるだろう。
あまりにも遅かったら使い物にならない。
つまり、どうやって効率的にデータベースを構築し、すばやく検索できるようにするか?
これが二つ目の課題。
さらに、もっと妄想する。
画像を縮小すればいいんじゃね?
はじめに縮小した画像でデータベースを作る。
縮小した画像は、たくさんの画像と類似性が一致する。データ量が少ないから。
その一致したものを同じカテゴリとしてデータベースに記録する。
これを段階的に行う。
小さい画像から段階的に類似性を比較して行き、最終的に元画像レベルで類似性を比較する。
こうすれば比較する画像の総数は少なくできる。
少なく出来れば早くなるでしょ?と妄想する。


っでまあ、作って見たいと思うわけだが、
自分自身にも課題がたくさん。

isk-daemon、これを使いこなさなければいけない。
まだ安定していないみたいだし。
というわけで、pythonを覚えないといけない。

インストールするのはlinuxだ。
しかし私はlinuxをよくわかっていない。そもそもlinuxマシンを持っていない。
最終的には類似画像検索サーバを作らないといけないわけだから、
マシンも必要だろう。開発するんだし。
遊びで専用サーバをレンタルなんて富豪なことはできない。庶民だし。

というわけで、
pythonの知識
linuxの知識
linux用のマシン
これだけ必要だ。


みんなのPython
価格:¥2,940
ショップ:楽天ブックス
Linuxの教科書
価格:¥1,680
ショップ:楽天ブックス

早速、本を購入。ただいま読書中。
次にマシンを買う。
ドスパラにatom搭載の安いやつがあった。稼動したらず~と動かすわけだから省電力なやつが良いのでは、と思った。
いずれにしても練習用またはスタートアップ用なんだから安いやつで十分。
linuxのディストリビューションはCentOSかなと、思っているので、
その本も続けて買ってこよう。
なぜCentOSなのか? なんとなく、知り合いが使っていたので。


嗚呼、
今度こそ最後までやり遂げたいなあ~
ってやるんだねオレ。

しかし相談できる人も、手伝ってくれそうな人もいない、
まずはモチベーションを維持するために、
そういう友達がほしいと、願うわけです。

だれか一緒に作りませんか~~

ってこんなインターネットの片隅で叫んでみたり。
嗚呼、そういえば仕事も忙しいんだ、と現実に戻ってみたり。

ぼちぼち、がんばります。
続いていたら、そのうち続きを書くでしょう。

|

« 席を譲る | トップページ | 考え中 »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/188069/43123330

この記事へのトラックバック一覧です: 画像で検索:

« 席を譲る | トップページ | 考え中 »