Непонятные цифры в конце URL, много дублей - как избавиться?

12
B1
На сайте с 05.01.2016
Offline
17
5433

Здравствуйте! Прошу помочь новичку!

Подскажите, как избавиться от большого числа появляющихся рандомных цифровых окончаний типа

адрессайта.com//2018/01/названиепоста/12345/

адрессайта.com//2018/01/названиепоста/12346/

адрессайта.com//2018/01/названиепоста/12347/

Сайт на wordpress.

Кто-то бесконечно создает запросы и адреса, которые индексируются яндексом и добавляются в поиск яндекса как дублирующий контент.

Помогите, как обрезать или запретить или перенаправлять такие адреса? Может плагином? .htaccess? robots.txt? Или как то в мастере яндекса ?

Павел Корчагин
На сайте с 04.03.2013
Offline
53
#1

rel=canonical

robots.txt у меня такой. Не знаю насколько правильно, но дублей на вордпрессе нет.

User-agent: *

Allow: */uploads

Disallow: /cgi-bin/

Disallow: /wp-admin/

Disallow: /wp-login.php

Disallow: /wp-content/plugins

Disallow: /wp-content/cache

Disallow: /wp-register.php

Disallow: /archive/

Disallow: /author/

Disallow: /search/

Disallow: /date/

Disallow: /trackback

Disallow: */trackback

Disallow: */*/trackback

Disallow: */*/feed/*/

Disallow: */feed

Disallow: /tag*/

Disallow: /?s=

Disallow: /*?*

Disallow: /*?

Host: ***.org

Sitemap: http://***.org/sitemap.xml

Hammer8
На сайте с 04.08.2011
Offline
178
#2

biz188, 404 страница настроена корректно?

адрессайта.com//2018/01/названиепоста/12347/ отдают 200 ответ или 404?

Проверить bertal.ru/

Полный спектр услуг по продвижению сайтов ()
B1
На сайте с 05.01.2016
Offline
17
#3

rel=canonical - да... может тут копать... Я недавно включил (раньше использовал, потом выключал) SEO by Yoast. Сейчас гугл выдает результаты, что оказываются многие убирают в SEO by Yoast «rel=”canonical”», не пойму почему они это делают. Но вроде это хорошо для сайта.

Убрать?

На страницах типа адрессайта.com//2018/01/названиепоста/12347/ есть код rel=canonical, но без цифр

<link rel="canonical" href="http://адрессайта.com//2018/01/названиепоста/" />

Это хорошо или плохо?

> 404 страница настроена корректно?

Если вводить неправильный адрес, то результатом будет страница - "По данному адресу ничего не найдено. Смотрите свежие записи" . Это корректно?

> адрессайта.com//2018/01/названиепоста/12347/ -

Проверил на bertal.ru. Результат;

HTTP/1.1 200 OK

Server: nginx/1.12.1

Date: Fri, 26 Jan 2018 20:29:50 GMT

Content-Type: text/html; charset=UTF-8

Connection: keep-alive

Link: <http://адрессайта.com/?p=1234>; rel=shortlink

Set-Cookie: wfvt_582754406=5e3fa45111; expires=Fri, 26-Jan-2018 20:59:50 GMT; Max-Age=1800; path=/; HttpOnly

robots.txt у меня для Яндекса такой , Disallow: */feed - вчера убрал, т.к. турбо-страницы потребовали.

User-agent: Yandex

Disallow: /cgi-bin

Disallow: /?

Disallow: /wp-admin

Disallow: /trackback

Disallow: */trackback

Disallow: */*/trackback

Disallow: /search/

Disallow: /author/

Disallow: /*/?replytocom=*

Disallow: /*/?replytocom

Disallow: /*?replytocom=*

Disallow: /*?replytocom

Disallow: *?replytocom

Disallow: /*?*

Disallow: /?s=

Disallow: */wlwmanifest.xml

Disallow: /xmlrpc.php

Allow: /wp-content/uploads/

Allow: */uploads

Allow: /*/*.js

Allow: /*/*.css

Allow: /wp-*.png

Allow: /wp-*.jpg

Allow: /wp-*.jpeg

Allow: /wp-*.gif

Allow: /wp-admin/admin-ajax.php

Host: адрессайта.com

Sitemap: http://адрессайта.com/

Ссылки все время добавляются, уже сотни. Что делать?!!! Помогите!

jpg statyandex.jpg
Hammer8
На сайте с 04.08.2011
Offline
178
#4
biz188:
> адрессайта.com//2018/01/названиепоста/12347/ -

Проверил на bertal.ru. Результат;
HTTP/1.1 200 OK
Server: nginx/1.12.1
Date: Fri, 26 Jan 2018 20:29:50 GMT
Content-Type: text/html; charset=UTF-8
Connection: keep-alive
Link: <http://адрессайта.com/?p=1234>; rel=shortlink

Как видите, некорректно настроена, вместо 404 ответа, 200 ответ.

По настройке очень много информации ipipe.ru/info/wordpress-404.html

B1
На сайте с 05.01.2016
Offline
17
#5
Hammer8:
Как видите, некорректно настроена, вместо 404 ответа, 200 ответ.
По настройке очень много информации ipipe.ru/info/wordpress-404.html

Поставил плагин, но, увы, ничего не получилось

При вводе несуществующей страницы типа адрессайта.com/2018/абракадабра получается 404

А если с любыми цифрами в конце нормального урла, то все равно 200

адрессайта.com/2018/01/названиепоста/12347/

HTTP/1.1 200 OK

samimages
На сайте с 31.05.2009
Offline
427
#6

1.сессии отключите.

2.все говно принудительно на 404 ответ через хтацес

Опыт как иммунитет — приобретается в муках! Хостинг: экономия до 1300 руб + домен в подарок ( https://clck.ru/XLscf ) / Аудит семантики от 15К [долго] - ЛС
Mik Foxi
На сайте с 02.03.2011
Offline
1168
#7

rel=canonical вас спасет.

Антибот, антиспам, веб файрвол, защита от накрутки поведенческих: https://antibot.cloud/ Форум на замену серчу: https://foxi.biz/
S
На сайте с 30.09.2016
Offline
469
#8

biz188, как уже дважды отметили выше, rel=canonical нужен. Тогда поисковик поймёт, какой адрес правильный.

А цифры в конце адреса в Вашем случае - это особенность движка Вордпресс, пагинация такая.

Отпилю лишнее, прикручу нужное, выправлю кривое. Вытравлю вредителей.
B1
На сайте с 05.01.2016
Offline
17
#9

Два дня назад включил SEO by Yoast, который добавляет вроде rel=canonical . Вобщем вот такие сейчас изменения за прошедшие сутки - несколько страниц Яндекс удалил. Позже еще отпишусь. Может кому поможет мой опыт.

> 1.сессии отключите.

> 2.все говно принудительно на 404 ответ через хтацес

.htaccess - тут я вообще не знаю, как сделать, еще изучаю. Немного разберусь - напишу. Буду рад вашему комментарию потом.

Сессии отключать тоже не понимаю пока. Еще не нашел ответа в гугле. Но спасибо за наводку.

Яндекс постоянно что-то добавляет и потом исключает. Например нормальной странице присвоил N / a ⇒ 301 не понятно почему.

Вот скрин за сегодня в Янедкс-вебмастере, Не знаю, влияет ли это на индексирование. И следствие ли это включения Yoast с canonical. И уже много раз Яндекс то добавлял, потом исключал, потом опять добавлял. Хоть с canonical , хоть без.

jpg statyandex2.jpg
samimages
На сайте с 31.05.2009
Offline
427
#10
biz188:
Сессии отключать тоже не понимаю пока.

У WP это, по-моему, штатная функция. В админке внимательно посмотрите.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий