Почему яндекс берет в индекс несуществующие страницы на сайте

M
На сайте с 12.06.2014
Offline
9
2880

Такая странная ситуация.

Есть сайт http://8-poster.ru/. Очень плохо индексируется. Из 20 000 страниц в поиске только 4000. Причем, очень много из них несуществующих:

http://8-poster.ru/authors/Hirosige_Ando/9/
http://8-poster.ru/authors/Bekman_Maks/7/
http://8-poster.ru/authors/Uel_Jan-Per-Loran/6/
http://8-poster.ru/themes/Nyu-York/-5/
http://8-poster.ru/authors/Kross_Anri/36/

1. Они появляются автоматически. Ссылки на них никто не ставит.

2. На правильные страницы(без лишних цифр аля 9/, -5/) добавлен текст, видео, чтобы дать понять яндексу о правильной.

3. В карте сайта разумеется их нету. Там правильные страницы.

4. Закрывать в robots.txt не реально. Их много и они все равно появляются.

Писал Платону. Получил стандартный ответ:

Вероятно, робот где-либо на Вашем сайте обнаружил ссылки на указанные Вами страницы, поскольку они доступны, робот проиндексировал их и включил в результаты поиска. Если страницы не должны индексироваться и участвовать в поиске, я советую Вам запретить их посещение в Вашем файле robots.txt. Также мы проверили, Ваш сайт присутствует в поиске и находится пользователями, но некоторые его страницы, включая указанную Вами, действительно отсутствуют в выдаче, при этом никаких санкций на них не наложено. Дело в том, что наши алгоритмы устроены так, чтобы на запросы пользователей давать наиболее полный ответ, и в связи с этим в поисковую базу попадают наиболее релевантные документы. Продолжайте работать над развитием Вашего ресурса, ориентируясь на его посетителей

-----

Внимание вопрос: что это такое и как с этим бороться?

MR
На сайте с 05.04.2014
Offline
1
#1

mopassan, настройте движок чтоб отдавал ошибку 404 по таким адресам. Бот не с проста их нашёл, вероятно где-то ссылки стоят на подобные страницы.

N
На сайте с 08.10.2011
Offline
188
#2

Первый день живем, если ответ будет 200 при дописывания в урл всякой бредятины, то проставив таких ссылок с других ресурсов можно кучу мусора вогнать в индекс

september
На сайте с 11.09.2009
Offline
591
#3

Почему нет?

Есть страницы с текстом "Ничего не найдено по вашему запросу, измените критерии поиска либо воспользуйтесь навигацией по каталогу:" и кучей внутренних ссылок.

А должно отдавать 404

Про 20к страниц тоже поржал - неужто все полезные? Тут вы ругаетесь, что мусор в индекс берет, а пишите, что должно быть еще больше мусора

$ карта для вывода вебмани в любой точке мира (https://www.epayments.com/registration?p=dc2462e885)
M
На сайте с 12.06.2014
Offline
9
#4

Вопрос еще в том почему яндекс их не удаляет и не оставляет основные? Закрывать их в ручную тоже тяжело и непонятно как - они генерируются постоянно и рандомно.

По мусору. Понятно что это магазин с примерно одинаковыми страницами, но мы нагружаем страницы текстом, видео. (http://8-poster.ru/authors/Ayvazovskiy_Ivan/)

То есть все делаем для "развития сайта и для удобства пользователя" а толку никакого.

kerpi
На сайте с 24.11.2011
Offline
22
#5

Копайте свой двиг, чтобы он не генерил левых страниц. Вся проблема в нем.

Нормальные сайты держу здесь (http://hostline.ru/index/partner/id/22292) Продвижение в буржунете (http://kerpiseo.com/) Консультации по оптимизации и продвижению сайтов в Яндекс\Гугл (http://forum.sape.ru/showthread.php?t=90585)
SAlex
На сайте с 27.07.2008
Offline
409
#6

Некорректно выполнен движок Вашего сайта. Правильный сайт должен отдавать 404 по несуществующим адресам. Если у Вас иначе, то проблема на Вашей стороне. Найдите квалифицированного программиста (сами Вы, вероятно, не справитесь) и сделайте работоспособный движок

иначе Яндекс будет индексировать несуществующие адреса, затем посчитает их копиями с целью спама, и в итоге наложит санкции на сайт.

DK
На сайте с 28.03.2010
Offline
54
#7

закрывать через meta noindex в header'е

one
На сайте с 15.04.2007
Offline
336
one
#8
Вопрос еще в том почему яндекс их не удаляет и не оставляет основные?

Потому что данные страницы отдают код 200 вместо 404. Сделайте как выше посоветовали. Правильно движок настройте, что бы не существующим страницам отдавал 404 ошибку.

Решения для автоматизации действий ( https://www.facebook.com/automationstudio20/ ) в интернете.
S
На сайте с 20.08.2007
Offline
140
#9

Посмотрите xml карту сайта, возможно там ссылки есть. Такое бывает при неправильной настройке генерации карты сайта.

Sanchila77
На сайте с 23.05.2011
Offline
66
#10

Все разобрался. Вопрос снят

Суровый модератор не разрешил мне показывать вам эту подпись :-)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий