2005年10月01日

Nutchなサイト

概要:オープンソースな検索エンジン「Nutch」なサイト。Apacheに参加したらしい

Nutchは、オープンソース・ウェブ検索エンジンを実装する初めての試みです。

ウェブ検索はインターネット・ナビゲーションのために必用な基本的機能です。ところが現在では、ウェブ検索エンジンの数は減少しています。今日の寡占状態は、すぐに、ほとんど全てのウェブ検索を提供している一つの会社の商業利用に独占されるかもしれません。一社の独占は、多くのインターネットのユーザーにとって良くないことです。

Nutch は、商用ウェブ検索エンジンには無い透過性(公開性)をもたらすものです。 Nutch による検索結果は、充分に偏見が無いことがわかっており、安心して検索をまかせることができます(少なくとも、Nutsh のバイアスは、公共のためのものです)。全ての既存の主な検索エンジンは、検索エンジン所有者の実装した公式によって順位が決められます。検索結果として与えられたページの順位付けの理由が説明されるわけではありません。その上、いくつかの検索エンジンは、各サイトがインデックス順位に対して支払った金額によって順位を決定する場合さえあります。 Nutch は各々のユーザーにできる限り最高の検索結果を与えようとするものであり、その結果や関係する情報に偏見を加える理由は何もありません。

Nutch は、誰でも簡単に、そして低コストで、効率よく国際的なウェブ検索エンジンを設置するのを可能にしようとするものです。これは、とても困難な挑戦です。 Nutch ソフトウェアが成功するためには以下の要件を満たした有能なものでなければなりません:

・一ヶ月ごとに10億ページを取ってくること
・これらのページのインデックスを維持すること
・1秒につき最高1000回の検索インデックスを付けること
・非常に高品質ですばらしい検索結果を提供すること
・最小のコストで動作すること
これはとても挑戦的な提案です。あなたが Nutch プロジェクトの価値を信じるならば、開発者として、又は寄付をしてこのプロジェクトを是非とも応援してください。
form Nutch: Nutchについて
http://search.itpub.net:8080/jp/about.html


■Nutch公式
Welcome to Nutch!(英語)
http://lucene.apache.org/nutch/
"Enjoy Nutch-ing/ナッチを楽しもう!"
http://www.nutch.jp/

■FAQ
Nutch: よくある質問
http://search.itpub.net:8080/jp/faq.html

■Wiki
TWiki . Main . Nutch
http://nutch.sourceforge.net/cgi-bin/twiki/view/Main/Nutch

■チュートリアル
Nutch: tutorial
http://search.itpub.net:8080/en/tutorial.html

■関連
"@IT:安藤幸央のランダウン 第23回"
http://www.atmarkit.co.jp/fjava/column/andoh/andoh23.html

"CNET Japan Blog - 梅田望夫・英語で読むITトレンド:オープンソース検索エンジン「Nutch」の皮算用"
http://blog.japan.cnet.com/umeda/archives/001303.html



posted by リンクしてる人 at 14:51 | Comment(0) | TrackBack(0) | 検索エンジン
関連IT用語解説 Powered by e-Words
関連書籍
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

この記事へのTrackBack URL
http://blog.seesaa.jp/tb/7561161