« ソフトウェアに必要なパターン・ランゲージとは | メイン | [お知らせ]独立しました »

検索エンジン"Nutch" Apacheに参加か

オープンソース検索エンジンの"Nutch"(日本語版は、こちら)が、Apache Software Foundationへの参加提案を提出した。

Nutchの特徴は、検索アルゴリズムを公開し、透明で公平な検索エンジンを構築することにある。また、Java製のテキストサーチエンジン"Apache Lucene"をベースにしているため、もともとApacheとのつながりは強かったようだ。

Nutchについては、梅田望夫・英語で読むITトレンドの「オープンソース検索エンジン「Nutch」の皮算用」、安藤幸央のランダウンの「オープンソース検索エンジン「Nutch」の実力」や、C|net Japanの「「Googleの検索結果に物申す」:オープンソースの検索エンジン」に詳しい。

Nutch自体は、Googleを脅かすような存在になることは考えていない。あくまでの検索エンジンとしてのオープンな実装を行おうとしているだけだ(そもそもJavaベースなので、パフォーマンスも期待しちゃだめ)。啓蒙や、社会的な意義が大きいといっているが、中規模であれば、自前でNutchを使って何ができるかを考えたほうが面白いだろう。

例えば、http://search.creativecommons.org/で、動いているNutchを触ることができる。このサイトのエンジンは、Creative Commonsを掲載しているサイトだけが対象になっており、使用しているライセンスが併記される仕組みになっている。これは、うまい使い方だと思う。なお、日本語でも文字化けはしないのだが、単語が理解できず、1文字マッチになってしまっているので実用性は低い。

Nutchは、トップレベルでの参加を希望しているが、開発者の人数も足りているし、これまでの実績も十分だし、受け入れられる可能性は高いだろう。なお、今回、Apacheに参加するにいたった理由は、ぐぐってみたがよく分からなかった(手詰まったのか、さらなる発展をねらったのか)。なんにせよ、面白いものがApacheに参加するのが確かだ。

12/21追記:現在、JakartaにいるLuceneを引き連れて、"search.apache.org"になるみたいです。PMCのチェアは、Nutchの、Doug Cutting氏。

12/27追記:トラックバックをいただいたanyontvさんのYahooがNutch支援を打ち切る!。なるほど、こういうことですか。

トラックバック

このエントリーのトラックバックURL:
http://www.arclamp.jp/mt33/mt-tracback.cgi/1375

この一覧は、次のエントリーを参照しています: 検索エンジン"Nutch" Apacheに参加か:

» search.apache.orgになるか! 送信元 ナッチ
MSNのbetaサーチからNutch検索語で見つかったこちらのarclamp.jpからNutch関連ニュースを見つかりました。 search.apache.orgになるか! “オープンソース検索エンジンのNutchが、Apache Software Foundationへの参加提案を提出した。順調にいけば、Apacheのトップレ... [詳しくはこちら]

コメントを投稿

(いままで、ここでコメントしたことがないときは、コメントを表示する前にこのブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)

About

2004年12月21日 10:40に投稿されたエントリーのページです。

ひとつ前の投稿は「ソフトウェアに必要なパターン・ランゲージとは」です。

次の投稿は「[お知らせ]独立しました」です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。

Creative Commons License
このブログは、次のライセンスで保護されています。 クリエイティブ・コモンズ・ライセンス.
Powered by
Movable Type