Большая проблема - в индекс Яндекса попало что-то странное

12
SO
На сайте с 08.06.2011
Offline
14
2571

Здравствуйте!

Помогите, пожалуйста, разобраться с проблемой. Раньше все было ок, сайт был в первой десятке. Затем было несколько атак на сайт, все уже давно (несколько месяцев как) исправили, почистили и пр.

Но, сейчас в индексе ПС нет основной страницы продукта (http://www.site.ru/product), а находятся такие страницы:

http://www.site.ru/find (такого вообще нет на сайте, я хотел удалить из индекса эту страницу, а Яндекс сообщил, что сервер не возвращает ошибку 404, значит, все ок. Хотя, если перейти по этой ссылке прямо из яндекса, у меня возвращает сайт мою страницу error404.html, которая прописана в .htaccess).

http://www.site.ru/product/index.html/

Это практически та страница, что и нужна. НО, почему яндекс добавил последний слэш? В результате этого страница отображается вообще непонятно каким образом.

http://www.site.ru/product/?gclid=....

Что еще за ?gclid? Откуда оно взялось...

В общем, я в ужасе. Ни у кого таких проблем не было? Во всех других ПС все в полном порядке.

[Удален]
#1

Возможно что остались страницы, проиндексированные при старом ЧПУ, а также страница поиска.

SO
На сайте с 08.06.2011
Offline
14
#2
uzumi:
Возможно что остались страницы, проиндексированные при старом ЧПУ, а также страница поиска.

Оно пропадет само собой при переиндексации (кстати, когда ее примерно ждать)?

И хотел бы еще уточнить вопрос - почему Яндекс говорит, что сервер не возвращает 404-ю ошибку при попытке удалить из индекса УРЛ http://www.site.ru/find? Ведь если его ввести в браузер - сразу перекинет на созданную мною страницу "ошибка 404".

neznaika
На сайте с 28.06.2006
Offline
356
#3

small_optimizator, дык запретите в robots и удалите, делов то.

Дорого покупаю настоящие сайты. Не инвестирую деньги и не беру кредиты.
SO
На сайте с 08.06.2011
Offline
14
#4
neznaika:
small_optimizator, дык запретите в robots и удалите, делов то.

Можно запрещать в robots даже несуществующие страницы/каталоги? Просто этого каталога нет вообще.

J
На сайте с 25.08.2010
Offline
12
#5
small_optimizator:
И хотел бы еще уточнить вопрос - почему Яндекс говорит, что сервер не возвращает 404-ю ошибку при попытке удалить из индекса УРЛ http://www.site.ru/find? Ведь если его ввести в браузер - сразу перекинет на созданную мною страницу "ошибка 404".

Страница, на которую производится перенаправление в случае ошибки сама должна возвращать 404 ошибку в заголовке, скорее всего ваша страница возвращает 200.

Appleman
На сайте с 06.11.2010
Offline
79
#6
small_optimizator:
Можно запрещать в robots даже несуществующие страницы/каталоги? Просто этого каталога нет вообще.

Да что угодно.

А потом после переиндексации удалите строчку, чтобы не мешала.

neznaika
На сайте с 28.06.2006
Offline
356
#7
small_optimizator:
Можно запрещать в robots даже несуществующие страницы/каталоги? Просто этого каталога нет вообще.

Откуда ползун знает есть страница на сайте или нет? :)

Вы ведь указываете ему, что её нельзя посещать.

Попробуйте уже и всё станет ясно.

SO
На сайте с 08.06.2011
Offline
14
#8
javsspb:
Страница, на которую производится перенаправление в случае ошибки сама должна возвращать 404 ошибку в заголовке, скорее всего ваша страница возвращает 200.

Можно объяснить, как это? Что конкретно нужно и где прописать, чтобы она возвращала в заголовке 404 ошибку? Неужели не достаточно просто прописать строку в .htaccess:

ErrorDocument 404 http://www.mysite.ru/pages/page404.html

?

O
На сайте с 02.06.2006
Offline
67
#9

Страница документа сайта должна отдать определенный код в своем хедере заголовке

200 - страница есть, 404 - страницы нет, ошибка

Проверяйте, что отдает страница к примеру здесь

http://mainspy.ru/otvet_servera

Вполне может оказаться, что код будет совсем другой, чем вы ожидаете.

SO
На сайте с 08.06.2011
Offline
14
#10
oldvovk:
Страница документа сайта должна отдать определенный код в своем хедере заголовке
200 - страница есть, 404 - страницы нет, ошибка

Проверяйте, что отдает страница к примеру здесь
http://mainspy.ru/otvet_servera

Вполне может оказаться, что код будет совсем другой, чем вы ожидаете.

Я уже проверил. Отдает код 200. То есть, при вызове несуществующей страницы, идет вначале код 302 (редирект на страницу 404.html), после чего загружается страница 404.html с кодом 200.

Что можно предпринять?

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий