インデックスとは?SEO対策をするなら必ず知っておくべき概念を解説!
これからSEO対策を実施したいという方には、「インデックス」を理解しておく必要があります。インデックスを理解し対策を取り組まなければ、どれだけ良い記事を作成しても成果が出ないという恐れがあるでしょう。
それにも関わらず、インデックスを理解せずにSEO対策をしてしまう企業は少なくありません。そこで、本記事ではインデックスの基本概念から、インデックスされるための対策について解説していきます。
SEOにおける「インデックス」とは
SEO対策をする上で、「インデックス」は必ず理解をしておくべき仕組みになります。本項では、下記の項目でインデックスに関して詳しく解説していきます。
- インデックスはGoogleのデータベースに登録されている状態
- 全てのページがインデックスされるわけではない
Googleのデータベースに登録されている状態
SEOにおいてインデックスとは、Googleの大規模なデータベースに保存されている状態を指します。
Googleは、大規模なデータベースに保存されたインデックス情報から、牽引して検索結果に反映しております。
検索の度に情報を取得しているのではなく、データベースからキーワードとマッチしたものを牽引しているので、特定のキーワードで検索をすると瞬時に検索結果をユーザーに届けることが出来ております。
そのため、Googleの検索結果に表示されるためには、インデックスされる必要があり、SEOで評価されるためには重要な項目となります。
全てのページがインデックスされるわけではない
先程紹介したように、Googleの検索結果に表示されるためにはインデックスされることが必要です。
ただ、全てのページでインデックスされるわけではありません。Googleにインデックスをする価値のないコンテンツと捉えられると、インデックスされることはないでしょう。
そのため、SEOで評価をされる土台としてWebサイトのインデックス対策を行う必要があります。
新規ページがインデックスされるまでの流れ
まずは、新規ページがインデックスされるまでの流れを理解していきましょう。下記がインデックスされるまでの流れとなります。
- 検出
- クロール
- レンダリング
- インデックス
検出
まず最初に「ページの検出」から行います。クローラーというGoogleのbotが、ページのURLを発見します。
URLを発見する際には、XMLサイトマップやリンクを辿って、ページの検出を行います。ページの検出時には、ページ内の情報を全て収集している訳ではなく、ページを発見しただけの状態になります。
クロール
ページの検出をした後に、「クロール」をします。クロールは、検出したページ内の情報を収集することを指します。
ページ内の情報を取得する際には、テキストだけでなく、画像や動画といったコンテンツの情報を収集していきます。収集した情報が、インデックスする価値のあるものかを評価していきます。
レンダリング
クロールされた後に、「レンダリング」をします。レンダリングとは、HTMLやCSS、JavaScriptなどの言語が、ブラウザを通して閲覧できるような形にしていく作業を指します。
レンダリングを行うことで、クローラーが視覚的にページ内の情報を確認することができます。また、レンダリングを正常に行えない場合、インデックスする価値のないページと捉えられてしまいます。
インデックス
クロールとレンダリングをした後に、Googleのデータベースに登録され、インデックスされます。
- クロールされ取得された情報がユーザーに価値のあるページ
- 正常にレンダリングされユーザーにとって問題のないページ
クロールからレンダリングまでの流れで、インデックスする価値のあると捉えられたページのみがインデックスされ、検索結果に反映されます。
新規ページをインデックスされやすくする代表的な対策5選
新規ページにインデックスされやすくする代表的な対策は下記の5つとなります。
- XMLサイトマップを更新する
- インデックス登録リクエストを行う
- 内部リンクを貼りクローラビリティを向上させる
- ページスピードの向上を図る
- 高品質なコンテンツを作成する
XMLサイトマップを更新する
新規ページにインデックスされやすくする対策1つ目は「XMLサイトマップを更新する」です。
XMLサイトマップとは、Webサイト内のコンテンツがどこに配置されているのかを示した地図のようなものになります。
クローラーは、一度も巡回したことがないページを、いきなり見つけることは難しく、見つけるまでに時間がかかってしまいます。ただ、XMLサイトマップを設置することで、新規ページがWebサイト内のどこに配置されているのかがわかるので、クローラーが巡回しやすくなります。
また、XMLサイトマップは自動で更新をしてくれる訳ではありません。そのため、新規ページを作成した際には、GoogleサーチコンソールからXMLサイトマップを最新のものに更新すると、新規ページをクローラーから認識してもらいやすくなります。
インデックス登録リクエストを行う
新規ページにインデックスされやすくする対策2つ目は「インデックス登録リクエストを行う」です。
Googleサーチコンソール上で、Google側にインデックス登録のリクエストを出し、クローラーの訪問を促すことができます。
Googleサーチコンソールの検索窓に対象のURLを入れ検索をした画面の右側の「インデックス登録をリクエスト」というボタンをクリックすることで、インデックス登録のリクエストをすることができます。
ただ、インデックス登録のリクエストをしたからといって必ずインデックスされるというわけではありません。
インデックス登録のリクエストを出してとしても、インデックスをする価値のないページであればインデックスはされないでしょう。
そのため、インデックス登録のリクエストはクロールをしてもらうための補助的なツールとして捉えておきましょう。
内部リンクを貼りクローラビリティを向上させる
新規ページにインデックスされやすくする対策3つ目は「内部リンクを貼りクローラビリティを向上させる」です。
クローラーは、リンクを辿ってページを検出します。クローラーにとっては、ページを一から探すよりもリンクを辿る方がページの発見にリソースがかからないからです。
そのため、内部リンクを設置し、孤立ページをなくすことで、クローラーがページを検出をしやすくなります。
ページスピードの向上を図る
新規ページにインデックスされやすくする対策4つ目は「ページスピードの向上を図る」です。
ページの表示速度が速いほどクローラーは少ないリソースでクロールをすることができます。
一方で、データ容量が大きく、表示速度が遅いページの場合には、クロールにリソースがかかり、クロールを完了する前にクローラーが離脱してしまう可能性があります。
そのため、ページスピードを向上させることで、インデックスされやすいページになります。
ページスピードを確認するには、PageSpeed Insightsの活用がおすすめです。
高品質なコンテンツを作成する
新規ページにインデックスされやすくする対策5つ目は「高品質なコンテンツを作成する」です。
Googleは、ユーザーを最優先に考えるという方針を掲げております。Googleから評価されるためには、ユーザーにとって価値のある高品質なコンテンツであることが重要です。
そのため、ユーザーにとって価値のある高品質なコンテンツであるほど、インデックスされやすくなると考えられます。
高品質なコンテンツの特徴としては下記が挙げられるでしょう。
- オリジナルな情報が盛り込まれているコンテンツ
- ユーザーの検索意図に答えられたコンテンツ
- 情報の信頼性が高いコンテンツ
- 誤字脱字がなくユーザーが理解しやすいコンテンツ
インデックスされるためには、上記のような特徴を持った、ユーザーに価値のある高品質なコンテンツを作成していきましょう。
インデックスされていることを確認する方法
新規ページを作成したら、インデックスされていることを確認しましょう。インデックスされていることを確認する方法は、下記の2つになります。
- site:を活用して確認をする
- Googleサーチコンソールで確認する
site:を活用して確認をする
インデックスされていることを確認する方法1つ目は「site:を活用して確認をする」方法です。
Googleの検索窓に、「site:対象URL」を入力することで、対象URLを含むインデックスされたページのURLを確認することができます。Googleの検索窓を活用するので、誰でもできますし手軽に調べることができるでしょう。
ただ、「site:対象URL」では、インデックスされていることを確認することはできますが、もしインデックスされていない場合には、現状どのようなステータスになっているのかを確認することができません。また、インデックスされていたとしても、いつクローラーが巡回したのかなどの細かい情報を取得すこともできません。
そのため、インデックスの状況に関して詳細の情報を取得したい場合には、下記で紹介する「Googleサーチコンソールで確認する方法」がおすすめです。
Googleサーチコンソールで確認する
インデックスされていることを確認する方法2つ目は「Googleサーチコンソールで確認する」方法です。
Googleサーチコンソールの上部にある検索窓に対象のURLを検索すると、インデックスされていることを確認することができます。また、Googleサーチコンソールで確認すると、下記のような詳しいインデックスの状況を確認することができます。
- 現状のステータス
- いつクロールされたのか
- どこから検出されたのか
- インデックスが許可されているのか
- 拡張機能の検出
インデックスの状況が詳細に記載されているので、インデックスされていない場合に、原因の特定に繋がります。
「site:を活用する方法」と「Googleサーチコンソールを活用する方法」では、取得できる情報が異なるので、目的によって使い分けていきましょう。
新規ページがインデックスされていない時に確認するべきこと
新規ページがインデックスされかった場合には、下記の5つが代表的な対策となります。
- noindexタグを設置していないか確認する
- robots.txtでクロール制御をしていないか確認する
- ページが重複していないか確認する
- ページの質が低くないか確認する
- 孤立ページとなっていないか確認する
noindexタグを設置していないか確認する
1つ目のポイントは、「noindexタグを設置していないか確認する」ことです。
noindexタグとは、インデックスを制御することができるタグになります。
本来、noindexタグは低品質なページなどのインデックスする必要のないページに設置するものです。ただ、ケアレスミスでnoindexタグを設置してしまう可能性も0ではありません。
例えば、サイト改修をする際にnoindexタグを誤って設置してしまうなんてこともあるでしょう。そのため、今一度noindexタグが設置されていないか確認をすると良いでしょう。
noindexタグが設置されていることを確認する方法としては、Googleサーチコンソールで確認することがおすすめです。
検索窓にURLを記入し「ページはインデックスに登録されていません: noindexタグによって除外されました」と表示される場合には、 noindexタグが設置されています。
もし、 noindexタグが設置されているのであれば、 noindexタグを解除することでインデックスされる状態に戻すことができます。
robots.txtでクロール制御をしていないか確認する
2つ目のポイントは、「robots.txtでクロール制御をしていないか確認する」ことです。
robots.txtとは、クローラーの動作を制御するためのテキストファイルになります。noindexタグはインデックスを制御するのに対して、robots.txtはクローラーそのものを制御します。
本来robots.txtは、クローラーがより重要なページを巡回するために、不要ページへのクロールを制御する目的で活用をします。ただ、noindexタグと同様にケアレスミスで誤った設定をしている可能性があるので確認をしましょう。
ページが重複していないか確認する
3つ目のポイントは、「ページが重複していないか確認する」ことです。
1つのページを生成する際に、複数のURLが生成されます。例えば、下記のようなURLです。
上記の例のように、ページが複数生成された状態のまま放置していると、Googleが重複コンテンツだと認識をし、インデックスされない可能性があります。
ページの重複は、Googleサーチコンソールで確認をすることができます。「重複しています。送信されたURLが正規URLとして選択されていません」と表示されれば、Googleから重複しているとみなされております。
ページが重複した際には、URLの正規化を行います。URLの正規化をすることで、Googleに「このURLが正しいURL」だと伝えることができ、重複を回避することができます。
ページの質が低くないか確認する
4つ目のポイントは、「ページの質が低くないか確認する」ことです。
Googleは、コンテンツの質が低い場合インデックスされない恐れがあります。下記のようなコンテンツはGoogleから低品質と捉えられる可能性が高いです。
- オリジナル情報がほとんどないコンテンツ
- キーワードが乱用されたコンテンツ
- 無断で複製されたコンテンツ
- 隠しテキストと隠しリンクがあるコンテンツ
- 自動生成されたコンテンツ
上記のようなコンテンツは、ユーザーにとって価値のないコンテンツとなります。Googleは、ユーザーに価値のないコンテンツをインデックスすることはありません。
そのため、ユーザーのためにならない低品質なコンテンツになっている場合には、リライトを行い高品質なコンテンツにブラッシュアップしていきましょう。
孤立ページとなっていないか確認する
5つ目のポイントは、「孤立ページとなっていないか確認する」ことです。
クローラーは、リンクを辿ってページを検出します。そのため、外部リンクも内部リンクも貼られていない孤立ページは、クローラーから検出されない可能性が高くなるでしょう。
孤立ページを探すには、Googleサーチコンソールを活用します。
- サイドメニューの「リンク」をクリック
- 内部リンクの「確認」をクリック
- 右上の3本線のボタンをクリック
- ターゲットページをクリックし対象のページを検索する
上記で検索をした際に何も表示されないページは内部リンクが貼られておらず、孤立したページとなります。孤立ページだった場合には、内部リンクをはりクローラビリティを向上させましょう。
公開して何日ほどでインデックスされるのか
新規ページを公開してインデックスされるまでは、サイトやページによって大きく異なります。
そのため、正確に何日でインデックスされるかを推測することは難しいです。ただ、今までの経験からお伝えすると、早くて1日ほど、遅くて3日ほどが目安となります。
新規ドメインや成熟していないドメインであるほど、インデックスに時間がかかる傾向があります。理由としては、クローラーがサイトに訪れる機会が少ないことからです。
そのため、成熟したサイトであるほど、検出〜クロールまでの流れが早く、インデックスされるまでの日数が少なくなるでしょう。