Google検索エンジンの仕組み


こちらの動画では、Google検索エンジンの仕組みをわかりやすく解説している。(動画を確認できない環境であれば、下にあるレジュメをチェックしよう。)

  1. クロール
  2. インデックス
  3. ランキング

Googleに私たちのサイトやブログが評価されるためには、この3つの工程があることをよく理解しておこう。

そして、繰り返しになるが検索エンジンロボットが私たちのサイトやブログにクロールしなければ、いつまでも検索結果に表示されることはない。簡単に言えば、Googleに私たちのサイトやブログを見つけてもらう必要があるのだ。

そこで、SEO対策としてはじめに理解しておきたいことはクロール最適化だ。詳しく内容を確認していこう。

>>SEO対策のファーストステップ「クロール最適化」をチェックする

こんにちは。私はGoogleエンジニアでサーティクオリティを担当しているMatt Cuttsです。今日はウェブ検索の裏側を紹介します。

実は、Google検索が行われるとき、ユーザーはウェブを検索しているのではなくのではなく、Googleが持つウェブのインデックス、つまりGoogleがウェブ上で見つけることができたものの中から検索をしているのです。

ウェブ上から情報を集めるとき、スパイダーというプログラムが使われています。スパイダーは最初にいくつかのウェブページの情報を取得し、次にそれらのページのリンクからリンク先のページの情報を取得します。

そしてさらにそのページのリンク先のページを辿り情報を取得していき、これを繰り返します。

こうしてとても大きなウェブのかたまりをインデックスします。数十億ものウェブページは何千ものマシンに保存されています。

たとえば、チーターの走る速さを知りたいとします。「チータ 走る 速さ」と検索ボックスに入力して実行すると、Googleのソフトウェアはインデックスを検索して、これらの検索クエリを含む全てのページを探します。この場合何十万ものページが該当するかもしれません。

ではGoogleはどうやって、ユーザーが本当に求めているページがどれかを判断しているのでしょうか?Googleでは200以上の「問い」を立てて、そこから判断します。

たとえばキーワードがそのページに何回含まれているか、そのキーワードはタイトルに現れているのか、それともURLか、またキーワード同士隣接して現れるのか、キーワードの類義語が含まれているか、そのページを所有するウェブサイトの品質は高いか、低いか、スパムであるかどうか、PageRankはどれくらいか、などの問いを立てて、各ページを評価している。

ちなみにPageRankとは、Googleの創立者Lerry PageとSergey Brinが発明したアルゴリズムで、どのくらい多くの、そしてどのくらい重要な外部からのリンクが存在するかによって各サイトを評価する仕組みです。

最終的に、私たちはこれら全ての要因を組み合わせて、各ページの総合得点を算出して検索結果をユーザーに返します。その間わずか0.5秒ほどです。

Googleは公平で役に立つ検索結果を届けることに真剣に取り組んでいます。お金をもらって、あるサイトをインデックスに追加することや、より頻繁にそのサイトのインデックス上の情報を更新すること、またそのサイトの順位を上げることは決してありません。

では、検索結果の一例を見てみましょう。

各エントリにはタイトル、URL、スニペットがあり、そのページが探していたページかどうかを判断できるようになっています。

他にも、類似ページへのリンクやGoogleが保存しているそのページの最新バージョンへのリンク、次に検索するかもしれない関連検索キーワードが表示されます。

検索結果の右側や上に広告が表示されることもあります。Googleは広告事業にも積極的に取り組んでいますが、広告主のためにより適した閲覧者に広告を配信し、ユーザーのためには見たい広告だけを表示するよう努力しています。

広告を通常の検索結果と区別できるように表示することに私たちはとても気をつけています。探している情報を見つけるのに役に立つ広告が見つからない時は広告は一切表示しません。

ちなみに、チーターが走る時の最高速度は時速100km以上です。

出展:Google

>>SEO対策のファーストステップ「クロール最適化」をチェックする

コメント