オープンソース検索エンジンの"Nutch"(日本語版は、こちら)が、Apache Software Foundationへの参加提案を提出した。
Nutchの特徴は、検索アルゴリズムを公開し、透明で公平な検索エンジンを構築することにある。また、Java製のテキストサーチエンジン"Apache Lucene"をベースにしているため、もともとApacheとのつながりは強かったようだ。
Nutchについては、梅田望夫・英語で読むITトレンドの「オープンソース検索エンジン「Nutch」の皮算用」、安藤幸央のランダウンの「オープンソース検索エンジン「Nutch」の実力」や、C|net Japanの「「Googleの検索結果に物申す」:オープンソースの検索エンジン」に詳しい。
Nutch自体は、Googleを脅かすような存在になることは考えていない。あくまでの検索エンジンとしてのオープンな実装を行おうとしているだけだ(そもそもJavaベースなので、パフォーマンスも期待しちゃだめ)。啓蒙や、社会的な意義が大きいといっているが、中規模であれば、自前でNutchを使って何ができるかを考えたほうが面白いだろう。
例えば、http://search.creativecommons.org/で、動いているNutchを触ることができる。このサイトのエンジンは、Creative Commonsを掲載しているサイトだけが対象になっており、使用しているライセンスが併記される仕組みになっている。これは、うまい使い方だと思う。なお、日本語でも文字化けはしないのだが、単語が理解できず、1文字マッチになってしまっているので実用性は低い。
Nutchは、トップレベルでの参加を希望しているが、開発者の人数も足りているし、これまでの実績も十分だし、受け入れられる可能性は高いだろう。なお、今回、Apacheに参加するにいたった理由は、ぐぐってみたがよく分からなかった(手詰まったのか、さらなる発展をねらったのか)。なんにせよ、面白いものがApacheに参加するのが確かだ。
12/21追記:現在、JakartaにいるLuceneを引き連れて、"search.apache.org"になるみたいです。PMCのチェアは、Nutchの、Doug Cutting氏。
12/27追記:トラックバックをいただいたanyontvさんのYahooがNutch支援を打ち切る!。なるほど、こういうことですか。
