Googleが嫌うスパム行為の1つに「ミラーコンテンツ」というものがあります。コンテンツが何であり、何が問題なのかを理解し、ミラーコンテンツによる損失がないようにしていきましょう。
ミラーコンテンツとは、同じWEBサイト内のコンテンツ、または別のサイトのコンテンツと全く同一か、非常に酷似したコンテンツのことを言います。「重複コンテンツ」「コピーコンテンツ」とも呼ばれ、このようなWEBページを大量に生成してページ数を増やし、ボリュームの多いWEBサイトに見せかけたり、良質なサイトをコピーして評価を上げようとするスパム行為です。
Googleは検索するユーザーに対し、できるだけ幅広い情報を与えたいと考えています。そのため、同じようなコンテンツが書かれているWEBページを検索結果の上位に表示させることはしないのです。原則としては最初にそのコンテンツに書かれたり、オリジナルのページのみを評価します。
また、スパム的な意図なく自然にミラーコンテンツが発生してしまうケースもあります。意図があってサイズ別、色別など商品が同じでも内容が少し違うだけの似たページが大量に発生してしまいます。このようなミラーコンテンツを回避するためにGoogleは、「URLが異なる、内容が同一または酷似したページが複数存在する場合に、その中で代表となるURLを指定することで重複を防ぐ」役割をもつ「canonical」という属性を使用することを推奨しています。
このような属性をうまく使用して、ミラーコンテンツやスパム認定を回避していきましょう。
次回はユーザー向けサイトマップと検索エンジン向けサイトマップについてご紹介していきます。