Googleが索引付けしたウェブページの正確な割合は不明であり、正確に計算するのも非常に難しい。Googleはウェブページを索引付けしてキャッシュするだけでなく、PDF、Word文書、Excelのスプレッドシート、Flashファイル、プレーンテキストファイルなど、様々な種類のファイルの「スナップショット」をとっている[11]。プレーンテキストやFlashファイル以外は (X)HTML に変換したものをキャッシュしており、対応するビューアやアプリケーションがなくても閲覧できるようにしている。
ユーザーは検索エンジンのカスタマイズとして、デフォルトの言語を設定したり、「セーフサーチ」機能でフィルタリングを設定したり、1ページに表示する検索結果数を設定したりできる。これらの設定はcookieとしてユーザーのコンピュータに長期的に保持しており、またユーザーが検索した単語の履歴を1年以上もの長期に渡ってcookieの形で保持している。 索引付けできないがオンラインで利用可能なデータはインターネット上に多数存在する。それらを深層Webなどと呼ぶが、Googleも含めた検索エンジンはそのようなデータをほとんどカバーしていない[12]。深層Webには、図書館の図書目録、立法府など政府機関の公文書、電話帳、あるいはデータベースへの動的なクエリによって生成されるコンテンツなどが含まれる。 国によってはプライバシー保護の観点から一部のリンクを示すことを禁じている。例えばスイスでは各個人が自分の名をGoogleの検索結果で見つけた場合、その削除をGoogleに要求できる[要出典]。 Google検索は最もよく使われる検索エンジンであるため、多くのウェブサイトはGoogleの検索結果で上位に表示されるようになる方法を熱心に探究している。そして、そのような方法をアドバイスするコンサルタント業も発生した。これを検索エンジン最適化と呼ぶ。 検索エンジン最適化は、ウェブページのコンテンツの改変と周辺の要因(ページランク)への対処に分けられる。ただし、やり方が極端だとスパムと判断される。 Googleはウェブサイト向けに検索エンジン最適化のガイドラインを公表している[13]。 Googleによれば、1回の検索クエリで消費されるエネルギーの総計は約1kJまたは0.0003kWhだという[14]。 2022年9月28日、スマートフォンで文字と写真を組み合わせて検索できる機能「マルチ検索」を日本語でも展開すると発表した。これまでは英語のみで提供していたが、今後数カ月で70カ国語に広げる。グーグルは人工知能(AI)を活用し、文字だけでなく音声や画像などによる検索機能を拡充させている。[15] Google検索は一連のローカライズされたウェブサイトから成る。その代表が google.com で、世界中で最もアクセス数が多いサイトである[16]。 Googleの検索エンジンは単純なテキストとしてクエリを受け付け、それを一連の検索語に分割する。検索語は一般に通常の単語であり、それが検索結果に含まれることになる。単語の並びを引用符 (") で囲んで1つの句としたり、ブーリアン演算子を使うこともでき、"+" や "-" を検索語の前につけたり、"site:" のような特殊な演算子を使うこともできる。"検索演算子 - Web Search ヘルプ 「検索オプション」というウェブフォームを使うと、検索結果を絞り込むための追加情報を入力できる。 Googleでは、送られてきた検索クエリにクエリ拡張を施し、実際に検索結果を得るためのクエリ形式に変換する。ページランク以外にGoogleがどのようなアルゴリズムで検索結果を決めているか詳細は不明だが、次のような変換が行われていることは確かである。 Googleのホームページには I'm Feeling Lucky と書かれたボタンがある。ユーザーがこのボタンをクリックすると、ユーザーは検索結果一覧ページをバイパスして検索結果の最上位のページに直接飛ぶことができる(飛ばされかねない)。
索引付け不可能なデータ
最適化詳細は「検索エンジン最適化」を参照
エネルギー消費
マルチ検索
機能
検索構文
クエリ拡張
検索語の並べ替え: 情報検索においては、結果を得るまでに要する作業量を減らす標準的な技法である。最終的に表示される検索結果はもともとのユーザーが指定した検索語の順序を考慮して順位を決定するため、この変換はユーザーには見えない。
ステミングという技法を使い、検索語の文法的な派生形を考慮し、検索の質を向上させる[17]。
クエリ内のスペルミスを修正する限定的な機能もある。
"I'm Feeling Lucky"
Size:101 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)』
担当:undef