【Google検索】キャッシュページが404 that’s an error になってしまう

この記事は最終更新から3年以上が経過しています。情報が古くなっている可能性があります。
こんにちは、しばです。
今回はGoogleのキャッシュページについてです。
この間他のトラブルの原因調査を行なっていた時に、Google検索結果のキャッシュページが404エラーになっているページを発見。
本命と何かしら関係があるんじゃないかな〜と思い、404エラーになる原因を調べてみました。
私が今回遭遇した404エラーのケースと合わせて紹介したいと思います。
Contents
Google検索結果のキャッシュページで404エラーが表示された
はじめにGoogle検索のキャッシュについて。
キャッシュはGoogleが保管している直近のウェブページの状態を表示してくれるという機能です。
削除済みのサイトやサーバーダウンしたサイトを見たいときなどに便利です。
下の画像は本サイトのキャッシュページ。
このキャッシュページには検索結果画面から飛んだりcache:URLでアクセスすることできます。
検索結果画面のスニペット右の▼をクリックすればリンクが表示される
Google検索の「cache:」コマンドでも同じページに飛べる
今回はこの機能で、下の画像のように”404. That’s an error.“となるページに遭遇しました。
キャッシュエラーのデメリット
まずエラーになることでどんな影響があるのか調べてみました。
Googleキャッシュシステムは独立して実行され、Googleとインデックスのリアルタイムのランキングには影響しないことに注意してください。
そのため、キャッシュがない場合でも、キャッシュエラーはサイトやランキングに問題があることを意味しません。引用元:
google — 「404。それはエラーです。」 Googleキャッシュから表示する場合
John Mueller from Google said on Reddit that if your cache link in Google returns a 404 error, that it doesn’t mean your rankings will be hurt in Google.
引用元:Google Cache Returns 404 Error Does Not Impact Your Rankings
Google翻訳)GoogleのJohn Mueller氏はRedditで、Googleのキャッシュリンクが404エラーを返しても、ランキングがGoogleに悪影響を与えるわけではないと述べた。
色々まとめると、
- キャッシュは独立したシステム
- ページのインデックスや検索のランキングに影響を与えるものではない
- Googleキャッシュ404エラーはGoogleキャッシュサーバーの内部的な問題であり、起こり得ること。それは何も意味しない。
とのこと。
これを見る限り、サイト運営者側への影響は簡易的に前回のクロール情報が見れなくなるくらいのようですね。
実質的なデメリットはなく、放っておいても害はない模様。
キャッシュが404エラーになる原因と対応案
先ほど「404エラーはキャッシュサーバーの内部的な問題なので起こり得る」とありましたが、じゃあ何が起因して発生するんだろう?ということで、今度は404エラーが発生するケースを調査してみました。
以下の時に404エラーになることが多いようです。
その1 MFIが有効になったサイト
MFIが適用されると通知メッセージがサーチコンソール上に届くのですが、この通知が届いたサイトで404エラーがよく報告されてます。
MFIというのはPCページからモバイルページへ評価基準を変更する動きのこと。
いまは条件が整ったサイトからその評価基準が適用されていっています。
2021/3頃には全てのサイトへ強制的にMFIが適用される予定なので、この時期まではこれが原因のケースが多そうですね。
その2 アクセス不可時にGooglebotがクロールしたサイト
例えば新しく公開したサイトなら公開前や試作していたとき、運用中のサイトならサーバーがダウンしていたときにクロールされた場合、キャッシュは404エラーとなるようです。
基本的にはどちらも現在インデックスされていれば時間が解決するとのこと。
不安であれば、念の為以下のような方法でチェックしておくと安心だと思います。
- サーチコンソールのURL検査(もしくはsite:コマンド)で問題がないか確認
→問題があれば適宜対策をとる - スマホ対応を実施する
→MFI適用時、モバイルフレンドリーじゃないサイトが404エラーになるという事例(推測)もありました。
どのみち全サイトMFIが適用されるので、スマホ対応されてない場合は対応されることをおすすめします!
わたしのケースでは
今回私が遭遇したケースではブログサイトで複数の記事だけ404エラーが発生していました。
- サイト構築から数ヶ月経っており、はじめの方にMFI適用済み
- モバイルフレンドリーテストは構築当初から問題なし
- 記事はサイト構築当初の方に書いたもので、サーチコンソールのURL検査では異常がなく最近クロールもされている
- 直近のクロール日時はサーバーダウンやサーバーメンテナンスの時間に該当しない
という状況で、上の原因は特に当てはまらず。
そこで404エラーの記事たちの共通点を調べたところ、
「いずれも早い時期に書いた記事であり、公開時と現在ではURL(パーマリンク)が2-3回ほど変わっている」
ということに気づきました。
個人的な推測ですが、パーマリンクを変更後クローラーがアクセスできなかった、そのあと移行を感知して移行先URLのキャッシュとして保管されたという可能性があるのかなぁと思ってます。
(URL変更時にキャッシュが継承されるものなのかも不明ですが…)
最後のパーマリンク変更から数ヶ月経っていてその後にクロールされているのでなんとも言えませんが、可能性としてこういうケースもあり得るという参考になればと思います。
さいごに
あんまり意識したことがない機能だったんですが、インデックスやランキング要因とは全く関連しない独立したものであることが知れたのは収穫だったなぁと思います。
以上、Googleキャッシュ404エラーについてでした!
参考
- キャッシュが404エラーになっている – Search Console Community
- GOOGLEのキャッシュが404になる
- Google、全サイトのモバイル ファースト インデックス移行を2020年9月に開始
- Google 検索結果でキャッシュされているウェブページの表示
- 404エラーについて