検索エンジンの仕組み

Joshua Hardwick 作成

Ahrefs 元コンテンツ責任者

検索エンジンは、ウェブクローラーを使用して数十億のページをクロールします。スパイダーやボットとも呼ばれるクローラーは、ウェブ上を巡回したりリンクをたどったりして、新しいページを見つけます。発見したページはインデックスに追加され、検索エンジンの検索結果となり、ChatGPT などの AI アシスタントの回答にも利用されます。

SEO 担当者にとって、検索エンジンの仕組みに対する理解は不可欠です。実際のところ、それが分からない状態でウェブサイトを最適化するのは難しいでしょう。

それが、このガイドで学ぶ内容です。


パート 1

検索エンジンの基本

検索エンジンとは何か、なぜ存在するのか、どのように収益を上げているのかを探ることから始めましょう。

検索エンジンとは何ですか?

ウェブコンテンツのデータベースである検索エンジンは、主に次の 2 つの部分で構成されています。

1
検索インデックス。ウェブページのデジタルライブラリ。
2
検索アルゴリズム。検索インデックスからクエリにマッチする結果を見つけ出すコンピュータプログラム。

検索エンジンの目的とは?

すべての検索エンジンは、ユーザーに最も関連性の高い最適な検索結果を提供することを目指しています。これができているかどうかが、検索市場のシェア獲得に影響します。

検索エンジンはどのように収益を得ているのでしょうか?

検索エンジンには次の 2 種類の検索結果が存在します。

1
検索インデックスから抽出されるオーガニック検索結果。料金を払えばここに表示されるという仕組みではありません。
2
広告主が利用する有料検索結果。料金を払うことでここに表示されるというシステムです。

有料検索結果がクリックされるたびに、広告主は検索エンジンに対価を支払います。この料金システムは PPC 広告として知られており、広告主の市場シェアが大きいほど収益が多くなります。また、検索エンジンのユーザーが多いほど、広告のクリックが増え、収益も増加します。

広告から収益を得る検索エンジン

有料結果とオーガニック結果の両方を表示する Google 検索結果のスクリーンショット

パート 2

検索エンジンがインデックスを構築する方法

各検索エンジンには、検索インデックスを構築するための独自のプロセスがあります。以下は、Google の構築プロセスを簡単に説明したものです。1

Google が検索インデックスを構築する方法

Google による検索インデックス構築プロセスを示した図:クロール、情報処理、およびインデックス化

詳しく見てみましょう。

URL

まずは既知の URL リストが出発点となります。Google のウェブページ発見方法はいくつがありますが、最も一般的な 3 つの方法は次のとおりです。

  • 被リンクからの発見。Google は何千億ものウェブページからなるインデックスを持っています。2誰かが既知のページに新しいページへのリンクを掲載すると、Google はそこから新たなページを見つけることができます。
  • サイトマップから取得。サイトマップは、サイト上の重要ページやファイルを Google に知らせます。3
  • 送信された URL から。Google の場合は、サイト所有者が Google Search Console から URL のクロールをリクエストすることができます。

クロール中

クロールは、スパイダーと呼ばれるコンピュータボットが既知の URL を訪問してダウンロードする処理です。Google の使用するクローラーは Googlebot です。4

情報処理とレンダリング

情報処理は、Google がクロールしたページの内容を理解し、重要な情報を抽出する段階で、これにはページのレンダリングが必要です。これは、ページがユーザーに対してどのように表示されるかを確認するために、ページのコードを実行する作業のことです。

Google 社員を除いては、誰もこのプロセスのすべての詳細を知りませんが、それは特に問題ではありません。リンクを抽出し、インデックス作成のためにコンテンツを保存するという作業が行われていることが分かっているだけで十分です。

インデックス化

インデックス化とは、クロールされたページから抽出・処理された情報が検索インデックスに追加されることです。

検索インデックスは、検索エンジンを使用するときに検索する対象となるデータベースです。ChatGPT、Claude、Gemini などの AI アシスタントも、ウェブページを見つけるために検索インデックスを使用しています。そのため、Google や Bing などの主要な検索エンジンにウェブサイトやページがインデックスされることがとても重要です。コンテンツがインデックスに含まれていなければ、ユーザーに見つけてもらうことができないからです。

ご存じですか?

Google は検索エンジン市場シェアは 91.43% に達しています。最も多くの人が使用する検索エンジンであるため、他の検索エンジンよりも多くのトラフィックをウェブサイトに送り込む可能性が高いでしょう。5


パート 3

検索エンジンがページをランク付けする方法

コンテンツの発見、クロール、インデックス化は初期段階に過ぎません。検索エンジンには、ユーザーが検索を実行したときに、マッチする結果を最適な順にランク付けする作業も必要です。これが検索アルゴリズムの仕事です。

検索アルゴリズムとは?

検索アルゴリズムとは、インデックスから関連結果を抽出してランク付けするための公式のことです。Google のアルゴリズムには様々な要素が含まれます。

主な Google ランキング要因

Google はすべてのランキング要因を開示していないため、正確な詳細は誰にも分かりません。とはいえ、主要な要因のいくつかは判明しています。そのうちのいくつかを見てみましょう。

被リンク

被リンクとは、あるウェブサイトのページから別のウェブサイトに飛ぶリンクのことです。多数の被リンクを獲得していることは、Google 検索上位にランクインするための最重要要素の一つです。6これが、10 億を超えるページを対象とした調査で、獲得リンク数とオーガニックトラフィックの間に強い相関関係が見られた理由でしょう。7

参照ドメインと検索トラフィックの相関関係

Ahrefs のコンテンツエクスプローラーインデックスに存在する 10 億以上のページを対象とした調査に基づく。

10 億超のページの参照ドメインと検索トラフィックの相関関係を示すチャート

ただし、リンクの数が多ければいいわけではなく、品質も重要です。少ない数の良質な被リンクを獲得しているページは、多数の質の悪い被リンクを獲得しているページよりも上位にランク付けされることがよくあります。

Ahrefs で、あなたのウェブサイトの被リンク獲得状況を無料チェックできます。

無料の Ahrefs ウェブマスターツールに利用登録し、サイトエクスプローラーにドメインを入力した後、被リンクレポートに移動してください。

ウェブサイトの被リンクデータを表示する Ahrefs サイトエクスプローラーのスクリーンショット

ウェブ上で 5 番目に活発な Ahrefs クローラーのおかげで、8ここではあなたのサイトの被リンク状況をかなり詳細に把握することができます。

関連性

関連性とは、検索者にとって特定のページがどれだけ有用かという判断基準です。Google は、さまざまな方法でこれを決定してしています。基本的には、検索クエリと同じキーワードを含むページを探します。また、他の人がその情報を有用だと感じたかどうかを示すインタラクションデータも参考にします。9

鮮度

ランキング要因としてのコンテンツの鮮度の重要度は、クエリによって変動します。例えば、最新情報を求める検索の場合、この要因はより強く働きます。9 そのため「新しい Netflix ドラマ」という検索に対しては最近公開された作品が上位結果に表示されますが、「ルービックキューブの解き方」といった検索では最新の情報が必ずしも検索上位に表示されないのです。

コンテンツ鮮度のランキング要因としての重要性はクエリによって変化

Google 検索結果で、コンテンツの鮮度はクエリによって重要度が変化するランキング要素であることを示す例

ページ速度

ページ速度は、デスクトップとモバイル端末両方の検索順位で上位ランクインするための要素の一つです。10 11とは言っても、これはプラスというよりはマイナスにはたらくことが多い要素です。というのも、超高速ページが他より高い評価を受けるわけではなく、速度の遅いページがマイナスに評価されるだけだからです。

Ahrefs でページ速度を無料チェックできます。

無料の Ahrefs ウェブマスターツールに利用登録し、Ahrefs のサイト監査でウェブサイトをクロールした後、パフォーマンスレポートに移動してください。通常、赤い部分が少ないほどウェブサイトの状態が良好だという意味です。

ページ速度とパフォーマンスデータを表示するAhrefs サイト監査のスクリーンショット

モバイル対応性

コンテンツのモバイル対応性は、2019 年に Google がモバイルファーストインデックスに切り替えて以来、モバイルとデスクトップ端末の両方で検索上位ランクインに必須の要素となっています。12


パート 4

検索エンジンによる検索結果のパーソナライズ

Google は各ユーザー向けに検索結果をカスタマイズしています。これにはユーザーの所在地、言語、検索履歴などの情報が使用されます。9 これについて詳しく見てみましょう。

ロケーション

Google はローカルな情報を求める意図の検索に対して、ユーザーの位置情報をもとに結果をパーソナライズします。そのため「イタリアンレストラン」の検索結果ではすべて地元地域のレストランが表示されます。Google は、ランチ場所の候補を見つけたい人は、ほとんどの場合住んでいる地区のレストランを対象に探していると分かっているからです。

言語

Google は、スペイン語ユーザーに英語の結果を表示しても意味がないと分かっています。そのため、特定の言語を話すユーザーに対して、(存在する場合は)ローカライズされたバージョンのコンテンツを上位表示します。

Google は異なる言語に対して異なる順位の検索結果を表示する

Google が異なる言語に対して異なる順位の検索結果を表示する例

検索履歴

Google は、よりパーソナライズされた検索体験を提供するために、ユーザーの行動や訪問したページなどの情報を保存します。13この機能をオフにすることもできますが、ほとんどの人はおそらくしていないでしょう。

重要なポイント

  • 検索エンジンは、インデックスとアルゴリズムという 2 つの主要要素で構成されています。
  • インデックスを構築するために、既知のページをクロールし、リンクをたどって新しいページを見つけます。
  • 検索アルゴリズムの目的は、最も関連性の高い最適な結果を表示することです。
  • 検索結果の精度向上は、市場シェア拡大のために重要です。
  • Google オーガニック検索結果での上位ランクインにつながるすべての要因を把握している人はいません。
  • 主要なランキング要素には、被リンク獲得状況や情報の関連性・鮮度が含まれます。
  • Google は、ユーザーの所在地、言語、検索履歴をもとに検索結果をパーソナライズします。

参照

  1. 「JavaScript SEO の基本を理解する」。Google。2022 年 8 月 16 日取得。
  2. 「情報の整理 — Google 検索の仕組み」。Google。2022 年 8 月 16 日取得。
  3. 「サイトマップについて学ぶ」。Google。2022 年 8 月 16 日取得。
  4. 「Googlebot」。Google。2022 年 8 月 16 日取得。
  5. 「世界の検索エンジンマーケットシェア」。Statcounter。2022 年 8 月 16 日取得。
  6. 「Google Q&A + #3月」。YouTube。2022 年 8 月 16 日取得。
  7. 「CloudFlare Radar」。CloudFlare。2022 年 8 月 16 日取得。
ガイド作成者Joshua Hardwick

Ahrefs の元コンテンツ責任者(簡単に言い換えると、Ahrefs が公開するすべてのブログ投稿のクオリティを保証する人物)。

SEO をステップバイステップでマスター

/01

検索エンジンの仕組み

SEO について学習する前に、まず検索エンジンの仕組みを理解しましょう。

/02

SEO の基本

SEO を成功させるウェブサイト作りを学び、SEO における 4 つの主要な側面を理解します。

/03

キーワードリサーチ

SEO の出発点は、ターゲットとなるお客様が何を求めて検索しているのかを理解することです。

/04

SEO コンテンツ

検索エンジンで上位に表示されるコンテンツの作り方をご紹介します。

/05

オンページ SEO

そして、検索エンジンが理解できるようにページを最適化することです。

/06

リンク構築

リンクは検索エンジンが新しいページを発見し、その「権威」を判断する方法です。リンクなしに競合の激しい用語でランクすることは困難です。

/07

テクニカル SEO

Google によるウェブサイトへのアクセスや、サイトの情報取得を妨げるような技術的な不具合がないことを確認することが大切です。

/08

AI が SEO にもたらす変化

現在、生成 AI に触れずに SEO について語るのは、もはや不可能です。