検索エンジンの仕組み

検索エンジンの仕組みを解説

検索エンジンの仕組み

はじめに

ユーザーがインターネットを利用する主な目的は、自分が知りたい情報について検索することがほとんどかと思います。その時に普段パソコンやスマホなどで何気なく利用しているのがGoogleやYahoo!などの検索エンジンです。

調べたい言葉を入力するだけで必要な情報がすぐに閲覧できる非常に便利な機能ですが、SEOを行う上では検索エンジンがどのような仕組みでできているか、どのように検索結果ランキングを順位付けしているかをきちんと理解することが重要になってきます。今回は検索エンジンの仕組みについて詳しく解説します。

検索エンジンとは?

検索エンジン

検索エンジンとは、インターネット上の情報を検索するシステムのことをいいます。調べたい言葉を「検索窓」に入力すると、その言葉に関連するウェブサイトや画像などが表示されます。

主な検索エンジンの種類としては、ロボット型検索エンジン、ディレクトリ型検索エンジンなどがあります。ロボット型検索エンジンとは、ウェブの情報を収集するロボットがウェブサイトのデータを収集しデータベース化されている検索エンジンです。ディレクトリ型検索エンジンとは、カテゴリごとに登録されたウェブサイトを検索することができる検索エンジンです。ロボット型検索エンジンの代表格がGoogleでしょう。また、ディレクトリ型検索エンジンであったYahoo!については、2018年3月でディレクトリ型のサービスを終了しています。

現在利用されている代表的な検索エンジンとしてはGoogle、Yahoo!、Bingがありますが、2018年現在ではGoogleが最も利用者が多く、日本を含めほとんどの国でシェアナンバーワンを誇っています。

Googleは検索した情報の精度が最も優れているため、2011年からYahoo!の検索エンジンもGoogleの検索技術を利用しています。そのためGoogleとYahoo!はほとんど同じ検索結果が表示されるようになっています(一部Yahoo!ニュースなどYahoo!独自のコンテンツが表示されたりする場合がありますのでまったく同じではありません)。

SEOでは、検索エンジンからより多くのユーザーを自分のウェブページに呼び込むことが必要です。そのため、検索エンジンの検索結果の順位を少しでも上げることがサイトの集客アップのカギとなります。そこで、ロボット型検索エンジンで上位表示されるために重要なクローリング、インデックスという2つの機能についての解説と、検索結果のランキング表示の仕組みについて詳しく紹介したいと思います。

検索エンジンの仕組み、クローリングについて

ウェブサイトを確認する女性

さて、検索エンジンはなぜ文字を入力しただけで必要な情報を適切に表示させることができるのでしょうか。

検索エンジンには、インターネット上にあるすべてのウェブサイトにどのような情報が書いてあるのか巡回するプログラム(クローラー)が使われています。クローラーによってウェブ上の情報を収集することをクローリングといいます。

1つのウェブサイトは多数のページで構成されていますが、クローラーはサイトを訪れるユーザーと同じようにウェブサイト上のリンクからリンクをたどっていき各ページの情報を読み取っていきます。また、収集の対象はウェブサイト上の文章だけではなく画像やPDFファイルなどの情報も取得しています。

このように、クローラーは日々膨大な量のウェブサイトを巡回していますが、作成したばかりのウェブサイトはまだクローリングされていない状態なので検索結果には表示されません。

そこで、より早く検索結果に表示させたい場合は、検索エンジン最大手Googleの提供するGoogle Search Console(グーグルサーチコンソール)に登録してサイトマップを送信するとクローリングされるようになります。

検索エンジンの仕組み、インデックスについて

検索エンジンで調べる男性

クローラーが検索エンジンに持ち帰った膨大なウェブサイトのデータは、そのままの状態では整理されていないのでインデクサとよばれるプログラムにより目次化・整理されて検索エンジンのデータベースに登録されます。これをインデックスといいます。

もともとインデックス(index)とは「索引」や「見出し」という意味がありますので、その意味の通り、検索エンジンはどのウェブサイトにどんな情報があるのかいつでも確認できるように、インデックスにわかりやすく整理整頓されているのです。Googleの検索インデックスにはおよそ数千億のデータが蓄積されているそうです。

また、公開前のウェブサイトなどをあえてインデックスさせたくない場合は、ウェブページのHTMLにnoindexと表記するとインデックスされなくなります。WordPressでは「検索エンジンがサイトをインデックスしないようにする」というチェックボタンもあります。

検索エンジンの仕組み、検索結果のランキング表示について

SEOについて考える女性

SEOにおいて最も重要とされる検索エンジンでの検索順位ですが、この検索結果のランキングはいったいどのように決められているのでしょうか。

検索エンジンでは、検索した人が満足するウェブページをより上位に表示させるために検索アルゴリズムというものを用いて検索順位を決定しています。

聞きなれない「アルゴリズム」という単語ですが、簡単に説明すると膨大なウェブページのランキングを決定するためのルールのようなものです。このルールはおよそ200ほどあるとされています。

ちなみに、このGoogleのアルゴリズムはより検索結果の精度を高めるために常に更新されています。そのため、数日前まで1位だったウェブページがアルゴリズムの変更により下位になってしまうといった現象がたびたび起こっています。

そのような状況にならないために、Googleの検索アルゴリズムについて詳しく知りたいところですが、残念ながらGoogleではアルゴリズムを非公開にしているため、どういう基準で検索結果のランキングが決定されるかはこちらで予想するしかありません。

参考として過去に一部公表された検索アルゴリズムの変更には以下のようなものがあります。

  • パンダアップデート
    中身のない低品質なウェブサイトを上位表示されにくくするアルゴリズム
  • ペンギンアップデート
    ブラックハットSEOと呼ばれる検索結果を上げるためだけに作られた悪質なウェブサイトを上位表示されにくくするアルゴリズム

この他にも、コンテンツの自動生成、オリジナルの記事ではないコピーコンテンツサイト、隠しリンクや隠しテキストがあるサイト、十分な付加価値のないアフィリエイトサイトなどが検索結果のランキング評価を下げる対象となっています。

Googleでは、ウェブマスター向けの品質に関するガイドラインとして以下のように書かれてあり、このガイドラインに沿ってウェブサイトを作成するように呼び掛けています。

【基本方針】

  • 検索エンジンではなく、ユーザーの利便性を最優先に考慮してページを作成する。
  • ユーザーをだますようなことをしない。
  • 検索エンジンでの掲載位置を上げるための不正行為をしない。ランクを競っているサイトや Google 社員に対して自分が行った対策を説明するときに、やましい点がないかどうかが判断の目安です。その他にも、ユーザーにとって役立つかどうか、検索エンジンがなくても同じことをするかどうか、などのポイントを確認してみてください。
  • どうすれば自分のウェブサイトが独自性や、価値、魅力のあるサイトといえるようになるかを考えてみる。同分野の他のサイトとの差別化を図ります。

出典:ウェブマスター向けガイドライン(品質に関するガイドライン)

Googleは一貫して、ユーザーの求める質の高いウェブサイトはおのずと上位に表示されるという方針を打ち出しています。このガイドラインに沿ったウェブサイトにすることで、検索上位を狙える可能性はあると思います。

ちなみに、このガイドラインに違反したりスパムサイトとみなされた場合、Googleのインデックスから完全に削除されてしまうという恐ろしい仕打ちが待っています。そんなことにならないためにも、Googleのアルゴリズムには常に注目しながらSEOを行うことが必要になってきます。

おわりに

SEOの文字

いかがでしたでしょうか?検索エンジンの仕組みを正しく理解すれば、自分のウェブページが上位表示されるために必要なことが見えてくるはずです。正しくSEOを行うためにも検索エンジンについての理解を深めておきましょう。

WEBでのお問い合わせはこちら