- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Здравствуйте! Прошу помочь новичку!
Подскажите, как избавиться от большого числа появляющихся рандомных цифровых окончаний типа
адрессайта.com//2018/01/названиепоста/12345/
адрессайта.com//2018/01/названиепоста/12346/
адрессайта.com//2018/01/названиепоста/12347/
Сайт на wordpress.
Кто-то бесконечно создает запросы и адреса, которые индексируются яндексом и добавляются в поиск яндекса как дублирующий контент.
Помогите, как обрезать или запретить или перенаправлять такие адреса? Может плагином? .htaccess? robots.txt? Или как то в мастере яндекса ?
rel=canonical
robots.txt у меня такой. Не знаю насколько правильно, но дублей на вордпрессе нет.
User-agent: *
Allow: */uploads
Disallow: /cgi-bin/
Disallow: /wp-admin/
Disallow: /wp-login.php
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-register.php
Disallow: /archive/
Disallow: /author/
Disallow: /search/
Disallow: /date/
Disallow: /trackback
Disallow: */trackback
Disallow: */*/trackback
Disallow: */*/feed/*/
Disallow: */feed
Disallow: /tag*/
Disallow: /?s=
Disallow: /*?*
Disallow: /*?
Host: ***.org
Sitemap: http://***.org/sitemap.xml
biz188, 404 страница настроена корректно?
адрессайта.com//2018/01/названиепоста/12347/ отдают 200 ответ или 404?
Проверить bertal.ru/
rel=canonical - да... может тут копать... Я недавно включил (раньше использовал, потом выключал) SEO by Yoast. Сейчас гугл выдает результаты, что оказываются многие убирают в SEO by Yoast «rel=”canonical”», не пойму почему они это делают. Но вроде это хорошо для сайта.
Убрать?
На страницах типа адрессайта.com//2018/01/названиепоста/12347/ есть код rel=canonical, но без цифр
<link rel="canonical" href="http://адрессайта.com//2018/01/названиепоста/" />
Это хорошо или плохо?
> 404 страница настроена корректно?
Если вводить неправильный адрес, то результатом будет страница - "По данному адресу ничего не найдено. Смотрите свежие записи" . Это корректно?
> адрессайта.com//2018/01/названиепоста/12347/ -
Проверил на bertal.ru. Результат;
HTTP/1.1 200 OK
Server: nginx/1.12.1
Date: Fri, 26 Jan 2018 20:29:50 GMT
Content-Type: text/html; charset=UTF-8
Connection: keep-alive
Link: <http://адрессайта.com/?p=1234>; rel=shortlink
Set-Cookie: wfvt_582754406=5e3fa45111; expires=Fri, 26-Jan-2018 20:59:50 GMT; Max-Age=1800; path=/; HttpOnly
robots.txt у меня для Яндекса такой , Disallow: */feed - вчера убрал, т.к. турбо-страницы потребовали.
User-agent: Yandex
Disallow: /cgi-bin
Disallow: /?
Disallow: /wp-admin
Disallow: /trackback
Disallow: */trackback
Disallow: */*/trackback
Disallow: /search/
Disallow: /author/
Disallow: /*/?replytocom=*
Disallow: /*/?replytocom
Disallow: /*?replytocom=*
Disallow: /*?replytocom
Disallow: *?replytocom
Disallow: /*?*
Disallow: /?s=
Disallow: */wlwmanifest.xml
Disallow: /xmlrpc.php
Allow: /wp-content/uploads/
Allow: */uploads
Allow: /*/*.js
Allow: /*/*.css
Allow: /wp-*.png
Allow: /wp-*.jpg
Allow: /wp-*.jpeg
Allow: /wp-*.gif
Allow: /wp-admin/admin-ajax.php
Host: адрессайта.com
Sitemap: http://адрессайта.com/
Ссылки все время добавляются, уже сотни. Что делать?!!! Помогите!
> адрессайта.com//2018/01/названиепоста/12347/ -
Проверил на bertal.ru. Результат;
HTTP/1.1 200 OK
Server: nginx/1.12.1
Date: Fri, 26 Jan 2018 20:29:50 GMT
Content-Type: text/html; charset=UTF-8
Connection: keep-alive
Link: <http://адрессайта.com/?p=1234>; rel=shortlink
Как видите, некорректно настроена, вместо 404 ответа, 200 ответ.
По настройке очень много информации ipipe.ru/info/wordpress-404.html
Как видите, некорректно настроена, вместо 404 ответа, 200 ответ.
По настройке очень много информации ipipe.ru/info/wordpress-404.html
Поставил плагин, но, увы, ничего не получилось
При вводе несуществующей страницы типа адрессайта.com/2018/абракадабра получается 404
А если с любыми цифрами в конце нормального урла, то все равно 200
адрессайта.com/2018/01/названиепоста/12347/
HTTP/1.1 200 OK
1.сессии отключите.
2.все говно принудительно на 404 ответ через хтацес
rel=canonical вас спасет.
biz188, как уже дважды отметили выше, rel=canonical нужен. Тогда поисковик поймёт, какой адрес правильный.
А цифры в конце адреса в Вашем случае - это особенность движка Вордпресс, пагинация такая.
Два дня назад включил SEO by Yoast, который добавляет вроде rel=canonical . Вобщем вот такие сейчас изменения за прошедшие сутки - несколько страниц Яндекс удалил. Позже еще отпишусь. Может кому поможет мой опыт.
> 1.сессии отключите.
> 2.все говно принудительно на 404 ответ через хтацес
.htaccess - тут я вообще не знаю, как сделать, еще изучаю. Немного разберусь - напишу. Буду рад вашему комментарию потом.
Сессии отключать тоже не понимаю пока. Еще не нашел ответа в гугле. Но спасибо за наводку.
Яндекс постоянно что-то добавляет и потом исключает. Например нормальной странице присвоил N / a ⇒ 301 не понятно почему.
Вот скрин за сегодня в Янедкс-вебмастере, Не знаю, влияет ли это на индексирование. И следствие ли это включения Yoast с canonical. И уже много раз Яндекс то добавлял, потом исключал, потом опять добавлял. Хоть с canonical , хоть без.
Сессии отключать тоже не понимаю пока.
У WP это, по-моему, штатная функция. В админке внимательно посмотрите.