検索エンジン(けんさくエンジン、search engine)とは、狭義にはインターネットに存在する情報(ウェブページ、ウェブサイト、画像ファイル、ネットニュースなど)を検索する機能を提供するサーバやシステムの総称。
インターネットの普及初期には、検索エンジンとしての機能のみを提供していたウェブサイトそのものを検索エンジンと呼んだが、現在では様々なサービスが加わったポータルサイト化が進んだため、検索エンジンをサービスの一つとして提供するウェブサイトを単に検索エンジンと呼ぶことはなくなっている。広義には、インターネットに限定せず情報を検索するシステム全般を含む。
狭義の検索エンジンは、ロボット型検索エンジン、ディレクトリ型検索エンジン、メタ検索エンジンなどに分類される。 広義の検索エンジンとしては、テキスト情報の全文検索機能を備えたソフトウェア(全文検索システム)等がある。 検索エンジンは、全文検索が可能なものと不可能なものがある。
目次
1 検索エンジン(狭義)
1.1 ロボット型検索エンジン
1.2 ディレクトリ型検索エンジン
1.3 メタ検索エンジン
2 検索エンジン(広義)
2.1 全文検索システム
3 歴史
3.1 黎明期
3.2 Yahoo!の独走
3.3 群雄割拠
3.4 Googleの台頭
3.5 検索エンジンの多様化
3.6 対応端末の多様化
3.7 テレビコマーシャルとの連動
4 リーガルリスク
4.1 深層ウェブ
4.2 著作権との関係
5 検索結果上位表示の組織化
6 社会的な問題
6.1 ストーカー行為の助長
6.2 学校裏サイトの問題
6.3 言論弾圧への加担
6.4 不明確な基準
7 そのほか
7.1 多言語化の課題
7.1.1 各種広告
8 主な検索エンジンサイト
9 サービスを終了した主な検索エンジンサイト
10 関連項目
11 脚注
12 外部リンク
//
与えられた検索式に従って、ウェブページ等を検索するサーバ、システムのこと。検索式は、最も単純な場合はキーワードとなる文字列のみであるが、複数のキーワードにANDやOR等の論理条件を組み合わせて指定することができるものが多い。
ロボット型検索エンジンの大きな特徴の一つとして、クローラ(スパイダー)を用いることが挙げられる。このことにより、WWW上にある多数の情報を効率よく収集(日本の著作権法では複製)することができる。大規模な検索エンジンでは、80億ページ以上のページから検索が可能になっている。
収集したページの情報は、前もって解析し、索引情報(インデックス)を作成する(日本の著作権法では編集)。