Дубли страниц – последствия древовидных комментариев

У WordPress есть одно замечательно достоинство – древовидные комментарии, когда ответ одного пользователя отображается под тем комментарием, на который он отвечал. Древовидность может иметь несколько уровней вложенности. Но у этой CMS возникает негативный побочный эффект – дубли страниц, появляющиеся при каждом новом комментарии в дереве структуры.

Дубли страниц, как известно, негативно влияют на продвижение сайта – страницы с одинаковым содержимым, но по разным адресам считаются поисковыми роботами, как взаимонеуникальные разные страницы, и понижаются как плагиат друг друга. Эффект неприятный. Рассмотрим, как от него избавиться.

Google и replytocom

Страницы с древовидными комментариями имеют в конце URL слово replytocom. Для Яндекса и большинства других поисковиков можно запретить к индексированию эти страницы с помощью стандартного метода – через robots.txt, прописав в этом файле:

Disallow: /*?replytocom

Disallow: /?replytocom

Однако, Google известен своим частичным игнорированием robots (от чего появляются так называемые сопли, о которых мы писали тут). Поэтому replytocom появляется в поисковой выдаче, как дубли страниц. Хоть и только в «соплях», от них лучше избавиться.

Как убрать replytocom

Чтобы убрать replytocom из дублей страниц, есть два хороших способа. Один из них связан с редактированием файла .htaccess. Этот метод удобен тем, что позволяет устранить replytocom сразу для всех поисковых роботов, этих страниц просто не будет существовать, они станут зеркалом.

Чтобы сделать это, записываем в .htaccess

RewriteCond %{QUERY_STRING} ^replytocom= [NC]

RewriteRule (.*) $1? [R=301,L]

Как видим, дубли страниц с replytocom передаются через редирект 301.

Другой способ попроще и работает только для Google. Заходим в панель вебмастера Google, переходим в пункт «Сканирование» и подпункт «Параметры URL». Здесь в разделе «replytocom» нужно выбрать «Изменить» и затем, в следующем окне выбрать пункт «Да». Всё, теперь Google не будет индексировать эти страницы.

Если дубли страниц уже появились в индексе, то их лучше удалить вручную из поиска. Если этих страниц собралось уже много (порой доходит до 1 000 и больше), придётся тратить очень много времени на их удаление. Однако можно попробовать понадеяться на автоматичность Google, возможно страницы попозже сами исключатся их поиска.

7 комментариев

Оставить комментарий
  1. Александр

    Большое спасибо!

  2. Очень нужная информация! Спасибо!

  3. Спасибо огромное за полезную информацию.

  4. Информация полезная.

  5. очень хороший сайт.

  6. Людмила Томчук

    Ни когда даже и не задумывалась,что дубли страниц негативно влияют на продвижение сайта.Буду знать .Спасибо.

  7. информация полезная, но для меня как начинающего очень сложно воспринимаемая.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *