Я проиндексил с сотню страниц сессиями

12
GEREM
На сайте с 29.03.2005
Offline
139
1265

В общем клиент поменял движок. Движок стал с сессиями (хотя я предупреждал), сразу я этого не заметил.

И бац - сразу же, как поменяли движок, заявляется робот Яндекса - и кушает с сотню страниц с сессиями.

Сессии программист удалил.

Но: Яндекс не хочет удалять страницы с сессиями посредством своей формы.

Вариант прописывать всё в роботсе.. Но: для каждой страницы что ли?

Не подскажите выход?

С уважением, Минин Михаил. mihailminin.livejournal.com (http://mihailminin.livejournal.com)
A
На сайте с 08.03.2003
Offline
203
#1

1) где пример страниц(-ы) с сесиями?

2) сейчас то основная версия без сессий?

Славгородский Алексей,
Ваш Партнер – создание и продвижение сайтов (http://vashpartner.ru/)
andrej-ilin
На сайте с 28.03.2005
Offline
42
#2

GEREM, сколько отдельных страниц попали под индексацию с сессиями и какого вида у них URL?

andrej-ilin@yandex.ru
GEREM
На сайте с 29.03.2005
Offline
139
#3

aleks, вот пример: www.***.ru/order/1?PHPSESSID=376bbe2d36d1dfaa855b4400547a1e92

Сейчас внутри сайта сессий нет, но если пройти по этой ссылке, то эта страница открывается.

andrej-ilin, порядка 350 на данный момент.

K
На сайте с 31.01.2001
Offline
737
#4

Придется отдавать по этим адресам код 404 или 301.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
andrej-ilin
На сайте с 28.03.2005
Offline
42
#5

GEREM, от этого есть лекарство

Disallow: /order/1?PHPSESSID=

Ну, а если страниц такого типа много:

..../order/1...

.../order/2...

...

.../order/350...

то выражаю глубокие соболезнования.

Можно, как вариант, проверять наличие подстроки "PHPSESSID=" в URL и отдавать при этом код 404.

GEREM
На сайте с 29.03.2005
Offline
139
#6

andrej-ilin, спасибо за соболезнования и за ответ. Думаю, придётся работать с роботсом.

Kost, Ваш вариант, по-моему, тоже подразумевает кучу работы. Но мне по душе больше старый добрый роботс, чем 301 редирект. А по 404 - предлагаете удалить страницы что ли?

andrej-ilin
На сайте с 28.03.2005
Offline
42
#7

GEREM, код 404 означает что документ не найден на сервере, хотя, сама страница может быть в браузере видна. Страницы с такими адресами удаляются из индекса. Если будете использовать - будьте осторожны. При неправильной настройке могут вылететь из индекса и другие страницы, а бывает, что и сайты целиком пропадают по этой причине. Вебмастер может и не сразу догадаться проверить код ответа сервера.

K
На сайте с 31.01.2001
Offline
737
#8
Kost, Ваш вариант, по-моему, тоже подразумевает кучу работы.

Думаю, что это примерно 1-3 строки в PHP-коде.

-----------------

if ( (User-Agent == робот) && session != "")

дать Header ("404 Not found");

endif

А тут выдать контент страницы.

-------------------------------------

GEREM
На сайте с 29.03.2005
Offline
139
#9

Дело в том ещё, что я напрямую не могу редактировать код движка, а программист деньги получил и теперь его фиг достанешь.

K
На сайте с 31.01.2001
Offline
737
#10

Тогда временно удалить весь /order/ через robots.txt - бесплатно, программист не нужен.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий