Небольшой лакомый кусочек для тех из вас, groovyReaders, которые ведут блог WordPress. Сегодня я выполнил поиск в Google, и несколько результатов groovyPost.com вернулись, однако первые 2 возвращенных были дубликатами друг друга. Да, это странно и действительно не очень хорошо для SEO IE: Dupe Content….
Оказывается, второй листинг (который был подделкой) заканчивался URL-адресом: /?replytocom=22264. Понятия не имею, что, черт возьми, это все значит, но, сделав быстрый поиск в Google, чтобы увидеть, насколько серьезной была моя проблема, я сделал следующий поиск в Google:
? Сайт ответа: www.groovypost.com
Пришло более 5000 результатов (о, отлично). Хорошие новости, исправить очень просто.
Рекомендуемое исправление
Добавление одной строки кода в Роботы.txt был самым быстрым и чистым методом, который я мог придумать, чтобы запретить поисковым системам индексировать эти строки-обманки. Просто добавьте следующую строку в файл robots.txt, который должен находиться в корень вашего сайта wordpress.
Запретить: *?replytocom
Я уверен, что вы могли бы добавить что-то в свой файл .htaccess, чтобы 301 перенаправить трафик на правильную ссылку, однако я считаю, что обновление файла robots.txt чистое и простое и не добавляет никакого раздувания вашему сайту.
Вариант 2
Для тех из вас, кто не хочет возиться с редактированием файла robots.txt (или не знаю как), тогда другой вариант — просто установить плагин, который, как я обнаружил, перенаправляет ботов на правильный URL-адрес. Он называется плагином Replytcom Redirector для WordPress. Просто скачайте, установите и активируйте из меню плагинов WordPress. После установки ничего не нужно настраивать.
Я обновил свой файл robots.txt сегодня вечером, поэтому я сообщу, как только увижу, что страницы исчезают из результатов поиска Google, так что следите за обновлениями.