こんにちは、こんばんは、おはようございます。
育児サラリーマン ロクロクです。
最近、仮想通貨のXPで遊んでます。
明日もXPコミュニティで祭りがあるみたいですので、仮想通貨が気になる方は、この機会に参加すると面白いかも!?
さて、余談はさておき、今日の話は、XMLサイトマップについてです。
sitemap.xml(XMLサイトマップ)とは
sitemap.xml(XMLサイトマップ)は、Google公式サイトで以下のように定義されてます。
サイトマップとは、サイトのウェブページのリストを指定して、Google や他の検索エンジンにサイトのコンテンツの構成を伝えるファイルです。
※引用元:サイトマップについて – Search Console ヘルプ
基本的に、ホームページを構成する各ページのURLや最終更新日などの要素を、それぞれXMLタグでマークアップすることでXMLファイル(sitemap.xml)が完成します。
このXMLファイル(sitemap.xml)をサーバー上に用意することで、ホームページにクローラーを呼び込み、検索エンジンへのインデックスを促進する効果が期待できます。
XMLファイル(sitemap.xml)のサイズや指定できるURLの数に制限があり、Google公式サイトで以下のように定義されてます。
1 つのサイトマップにはサイズが 50 MB(圧縮しない状態で)以下、URL が 50,000 件以下という制限があります。
※引用元:サイトマップを作成、送信する – Search Console ヘルプ
このようにGoogleでサポートされ、以下のよう公式に推奨されてるサイトマップ形式が、XMLファイル(sitemap.xml)となります。
Google は標準のサイトマップ プロトコルをサポートしています。また、動画、画像、ニュースの各リソース用の XML 拡張機能もサポートしています。
※引用元:サイトマップを作成、送信する – Search Console ヘルプ
なぜ分割できるプラグインがいいのか?
サイトマップに記載されているurlが増えると処理が重くなるのだ。
サイトマップ ファイルで指定する URL は 50,000 個以下、ファイルサイズは圧縮されていない状態で 10 MB 以下にする必要があります。
とGoogle様はいっておられるが、これはあくまで上限の話だ。例えばGoogle XML Sitemapsが仕様変更して月毎に分割するようになったのは処理を軽くするためである。記事の数が膨大になると1つのrobots.txtファイルに全て列挙するよりも期間を区切って複数のファイルに小分けしたほうが処理が速く終わる。
Google側の処理時間
どうやらGoogle側での処理時間もサイトマップのurlが増えるとそれに比例して伸びるらしい。100記事を超えたぐらいのサイトマップ(1ファイルに全て書き込み)で3~4日ぐらいはかかったかな?
サイトマップのファイルを分割すれば、1日もあればインデックス完了するようになった。
どうやら小分けにしたサイトマップのほうが圧倒的に速いようだ。Fetch as Googleで無理やりインデックスさせても実際に処理が完了して「インデックスに登録済み」となる前に気がついたら検索結果から消えている事もあるので処理は速いほうがありがたい。
XML Sitemap & Google News feedsがオススメ
WordPressのsitemap作成プラグインは、一番人気はGoogle XML Sitemapsだが、XML Sitemap & Google News feedsもなかなか悪くない。
XML Sitemap & Google News feedsはインストール直後の状態では1つのサイトマップに全て記述だが設定をいじれば年か月毎に分けられる。
さらに画像もサイトマップに含められる。デフォルトで画像込みになっているが、画像が多くなるとそのぶんGoogleでの処理時間が伸びるようだ。
記事の優先度を自動計算するようにできたりと設定で迷う要素が少ないのでものぐさにはこちらがいいかも。処理そのものはGoogle XML Sitemapsのほうが速いような感じ。
XMLサイトマップのまとめ
sitemap.xml(XMLサイトマップ)をうまく活用し、各ページのクロールパフォーマンスを高めましょう。
クロールされやいサイトを構築し、良質なページをインデックスさせながら、順位上昇を目指すことが重要です。
ちなみに、こんな記事も書いてるので、気になる方はどうぞ。
