Ребята...какой-то ахтунг с индексацией дублей

123 4
S2
На сайте с 03.04.2016
Offline
5
1436

Суть проблемы: в первых числах августа произошел апдет поисковой выдаче. В Вебмастере яндекса - обнаружил что количество проиндексированных страниц возраслов 1000 раз. Индексируются дубли которых оказалась просто НЕМЕРЯНО. Адреса подобные:

http://site.рф/index.html/snegohody/motowezdehod/snegohody/motowezdehod/snegohody/articles/articles/dokumentacija/motobuksirovshhik_volgar_peredneprivodnyj/motobuksirovshhik_volgar_peredneprivodnyj.html

и так далее.

Платон ответил:

По всей видимости, робот где-то в интернете обнаружил ссылки на подобные адреса и поэтому попытался их проиндексировать, а поскольку страницы были доступны и отдавали контент, они были успешно проиндексированы.

Выяснить, откуда именно роботу стали известны те или иные страницы, не представляется возможным, поскольку нашей в базе просто не сохраняются данные об этом. Со своей стороны могу порекомендовать Вам проверить исходный код доступных страниц сайта на предмет наличия подобных ссылок.

Я замечу, что сайт стоит на чистом HTML уже не первый год...подобного не было, сторонние расширения не ставил. Меня больше интересует, как теперь запретить индексацию страниц начинающихся с index.html/

В роботс прописал:

Disallow: /index.html/snegohody/

поможет?

Jaf4
На сайте с 03.08.2009
Offline
804
#1

при переходе на несуществующую страницу какой код отдает сервер?

New! NVMe VPS от SmartApe.ru (https://goo.gl/eoYYkS)
S2
На сайте с 03.04.2016
Offline
5
#2
Jaf4:
при переходе на несуществующую страницу какой код отдает сервер?

Страница доступна в яндексе стоит - 200

---------- Добавлено 04.08.2016 в 23:22 ----------

что за ерунда - еще три тысячи страниц в индекс добавились

---------- Добавлено 04.08.2016 в 23:28 ----------

Структура сайта стала:

богоносец
На сайте с 30.01.2007
Offline
756
#3
Serebro2009:
Страница доступна в яндексе стоит - 200

А может проблема в том, что ваш сервак отвечает 200 на всё?

S2
На сайте с 03.04.2016
Offline
5
#4
богоносец:
А может проблема в том, что ваш сервак отвечает 200 на всё?

Да я понимаю что проблема в хостере...но как быть?)

богоносец
На сайте с 30.01.2007
Offline
756
#5

Ну как быть, кричать, что виноват тупой бот, кто же ещё.

S2
На сайте с 03.04.2016
Offline
5
#6
богоносец:
Ну как быть, кричать, что виноват тупой бот, кто же ещё.

как правильно закрыть индексацию страниц начинающихся с /index.html?

L
На сайте с 07.12.2007
Offline
351
#7
Serebro2009:
В роботс прописал:
Disallow: /index.html/snegohody/
поможет?

Не поможет, ваш сайт откликается даже на такие левые url:

снегоход.рф/index.html/девочки по вызову/позвонить/index.html

и на этой странице уже все ссылки будут с "девочками по вызову" в uri. И в индексе будет ещё +3000 страниц.

У вас роутинг в движке сайта сломался, надо лечить причину, а не пытаться прятать внешние проявления.

S2
На сайте с 03.04.2016
Offline
5
#8
Ladycharm:
Не поможет, ваш сайт откликается даже на такие левые url:

и на этой странице уже все ссылки будут с "девочками по вызову" в uri. И в индексе будет ещё +3000 страниц.

У вас роутинг в движке сайта сломался, надо лечить причину, а не пытаться прятать внешние проявления.

Да нет движка...я же сказал - сайт статичный, чистый html, что лечить и где?

---------- Добавлено 05.08.2016 в 01:17 ----------

Новые папки на сайте нашел...anonymus ftp

и емейлы непонятные в php.ini: john@doe.com

---------- Добавлено 05.08.2016 в 01:29 ----------

Нет, дело не в папках...сайт перезалил. Черт, значит настройки сервера?

Metal Messiah
На сайте с 01.08.2010
Offline
152
#9

Может хакнули? Дор?

Нужно чтобы сервер правильно отдавал коды ошибок HTTP. Никакой robots без этого не поможет.

anonymous, думай что говоришь и не забывай подписать отзыв :)
Jaf4
На сайте с 03.08.2009
Offline
804
#10

Хостинг впс или шаред?

Файл .htaccess есть?

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий