Смотрит ли Яндекс на .htaccess

12
kolik
На сайте с 13.04.2007
Offline
34
1000

Есть сайт. Все страницы открываются в браузере, HTTP заголовки: 200 OK (!), но на сервере страниц не существует. Идет замена урл при помощи .htaccess на страницу со скриптом php, который при помощи include() подключает нужную страницу из другой папки.

Собственные наблюдения: Некоторые из таких сайтов Яндекс индексирует... некоторые нет... некоторые начинает индексировать только после того, как убирается перенаправление и заливаются действительные файлы. Вопрос: смотрит ли яндекн на то, что написано в htaccess (на замену адресов страниц) и влияет ли это на индексацию? Или это совпадения просто? Видит ли Яндекс, что файлов на самом деле на сервере нет?

IV-й
На сайте с 23.06.2009
Offline
159
#1

Нет, Яндекс работает со стороны клиента

ZoomY
На сайте с 07.11.2008
Offline
165
#2

.htaccess всем отдаёт одно и тоже? И Яндексу, и браузерам, и ботам и всем остальным?

Размещу ваши статьи на сайтах с тИЦ до 1400 по 5$ (/ru/forum/846111) Сейчас многие ищут хостинг за пределами России. Ukrnames - один из лучших вариантов: (http://ukrnames.com/?ref_id=114) и лидер рынка, и привычно, и по-русски, и вне юрисдикции РФ.
M1
На сайте с 13.02.2007
Offline
123
#3
kolik:
Видит ли Яндекс, что файлов на самом деле на сервере нет?

Да, яндекс определяет сайты, отдающие код 200 на запрос несуществующих файлов. Лучше отдавать 404.

kolik:
Вопрос: смотрит ли яндекн на то, что написано в htaccess (на замену адресов страниц) и влияет ли это на индексацию?

Нет, .htaccess при правильно настроенном сервере недоступен для запроса клиенту, боту в ТЧ.

kolik
На сайте с 13.04.2007
Offline
34
#4
ZoomY:
.htaccess всем отдаёт одно и тоже? И Яндексу, и браузерам, и ботам и всем остальным?

всем одинаково

ZoomY
На сайте с 07.11.2008
Offline
165
#5
Mr 13:
Да, яндекс определяет сайты, отдающие код 200 на запрос несуществующих файлов. .

А как он это делает? Где-то можно почитать об этом? Или расскажите. Он же дальше ответа сервера влезть не может.

ZoomY добавил 24.12.2010 в 10:15

kolik:
всем одинаково

Тогда проблем быть не должно абсолютно никаких, нормальная индексация.

Anarchist
На сайте с 23.07.2008
Offline
185
#6
ZoomY:
А как он это делает? Где-то можно почитать об этом? Или расскажите. Он же дальше ответа сервера влезть не может.

Я так понял, что речь идет о ситуации, когда какую бы хрень вы на сайте не написали в адресной строке (http://yoursite.ru/some_page.not_exist.html) сервер выдаст какую-нибудь страницу с ответом 200.

Например, такое очень часто встречается на страницах результатов поиска по сайту. Ничего не найдено, зато ответ 200 и запрос в заголовке и теле документа присутствует. В результате - куча мусора и дублей с пустыми страницами.

ZoomY
На сайте с 07.11.2008
Offline
165
#7
Anarchist:
Я так понял, что речь идет о ситуации, когда какую бы хрень вы на сайте не написали в адресной строке (http://yoursite.ru/some_page.not_exist.html) сервер выдаст какую-нибудь страницу с ответом 200.
Например, такое очень часто встречается на страницах результатов поиска по сайту. Ничего не найдено, зато ответ 200 и запрос в заголовке и теле документа присутствует. В результате - куча мусора и дублей с пустыми страницами.

Да, видел такое.

Ну там хоть дубли.

А если дублей нет?

*представляет себе вежливый услужливый сервер, который на любой запрос говорит "пажалуста нащяльнике, вот ваша страницэ 200"*

Anarchist
На сайте с 23.07.2008
Offline
185
#8

ZoomY, один фиг будут выдаваться либо дубли существующих страниц, либо на несуществующей(и отдающей 200) нарастет большое количество дублей самой себя. А уж что она там содержит - вопрос другой.

Тот же 404 Not found (крупными буквами на белом фоне) может отдавать 200 и расплодиться на куче страниц, которые яша жрет с удовольствием, а потом говорит, что вы - редис и надо вас забанить.

ZoomY
На сайте с 07.11.2008
Offline
165
#9
Anarchist:
ZoomY, один фиг будут выдаваться либо дубли существующих страниц, либо на несуществующей(и отдающей 200) нарастет большое количество дублей самой себя. А уж что она там содержит - вопрос другой.
Тот же 404 Not found (крупными буквами на белом фоне) может отдавать 200 и расплодиться на куче страниц, которые яша жрет с удовольствием, а потом говорит, что вы - редис и надо вас забанить.

Я так понимаю, что в ситуации ТС при запросе yoursite.ru/page_that_intends_to_be_displayed.htm подставляется 200 и выдаётся соответствующий контент, а при yoursite.ru/page_that_does_not_exist.htm выдаётся 404. То есть дубли тут исключены.

kolik
На сайте с 13.04.2007
Offline
34
#10

У меня два сайта на одном собственном движке. Чтобы постоянно не заливать обновленные скрипты на оба сайта, я обновляю их только на первом, а второй берет страницы со скриптами из первого, но контент туда подставляется оригинальный, у каждого сайта своя оригинальная БД с контентом. Одинаковые только скрипты и соответственно адреса страниц... например foto.php выдаст соответствующие фотографии, разные для обоих сайтов, причем файл foto.php на одном сайте есть, на другом нет, но заголовки везде 200 ОК (как и задумано), второй сайт работает с .htaccess.

Если страница не существует на первом сайте (no_page.php), то выдается 404 на обоих сайтах, естественно.

Первый сайт индексируется, второй нет.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий