検索エンジンが検索結果に表示できるのは、検索エンジンのクローラーによるインデックス登録が明示的にブロックされていないページに限られます。一部の HTTP ヘッダーとメタタグは、ページをインデックスに登録すべきでないことをクローラーに伝えるものです。
検索結果に表示したくないコンテンツについてのみ、インデックス登録をブロックします。
Lighthouse のインデックス登録の監査が失敗する仕組み
Lighthouse では、検索エンジンがインデックス登録できないページにフラグが設定されています。
Lighthouse では、すべての検索エンジン クローラをブロックするヘッダーと要素のみがチェックされます。たとえば、次の <meta>
要素では、すべての検索エンジン クローラー(ロボット)によるページへのアクセスを許可できません。
<meta name="robots" content="noindex"/>
次の HTTP レスポンス ヘッダーは、すべてのクローラもブロックします。
X-Robots-Tag: noindex
次のように、特定のクローラをブロックする <meta>
要素を指定することもできます。
<meta name="Googlebot" content="noindex"/>
Lighthouse では、このようなクローラー固有のディレクティブの監査に不合格になることはありませんが、それでもページが検出されにくくなることがあります。使用する際はご注意ください。クローラー固有のディレクティブが一般的なインデックス登録 bot をブロックしている場合、Lighthouse では警告が表示されます。
検索エンジンがページをクロールできるようにする方法
まず、ページが検索エンジンのインデックスに登録されていることを確認します。サイトマップや法律関連のコンテンツなど、一部のページは一般的にインデックスに登録されません。(ただし、インデックス登録をブロックしても、ユーザーが URL を知っているページはアクセスできなくなるわけではありません)。
インデックスに登録するページで、検索エンジン クローラをブロックしている HTTP ヘッダーまたは <meta>
要素を削除します。サイトの設定に応じて、以下の手順の一部またはすべてを行う必要があります。
- HTTP レスポンス ヘッダーを設定する場合は、
X-Robots-Tag
HTTP レスポンス ヘッダーを削除します。
X-Robots-Tag: noindex
- 次のメタタグがページの見出しに含まれている場合は削除します。
<meta name="robots" content="noindex">
- 特定のクローラーをブロックするメタタグがページの見出しにある場合、使用しないでください。例:
<meta name="Googlebot" content="noindex">
その他の設定を追加(省略可)
検索エンジンがページをインデックスに登録する方法をより詳細に管理したい場合は、たとえば、Google に画像をインデックスに登録したくないが、ページの残りの部分はインデックスに登録したい場合があります。
特定の検索エンジン用に <meta>
要素と HTTP ヘッダーを設定する方法については、次のガイドをご覧ください。
関連情報
- [ページのインデックス登録がブロックされる] 監査のソースコード
- Google の robots メタタグと X-Robots-Tag HTTP ヘッダーの仕様
- Bing の Robots メタタグ
- Yandex の HTML 要素の使用