Индексация динамических страниц

N
На сайте с 20.07.2001
Offline
3
#11

to tsv:

сэнкс, пойду пробовать

с уважением, njnj
EB
На сайте с 11.10.2001
Offline
7
#12

Всем привет!

Прям попал куда надо

А то я тут в другом углу форума, про проблемы с индексацией php интересовался.

Персональное спасибо tsv

Bee
T
На сайте с 04.07.2001
Offline
17
tsv
#13

Сынкс. Доброе слово и кошке приятно

AiK
На сайте с 27.10.2000
Offline
257
AiK
#14

Есть одна неприятность.

Вот ответ сервера с этой страницы(статика)


HTTP/1.1 200 OK
Date: Thu, 11 Oct 2001 20:56:41 GMT
Server: Apache/1.3.20 (Unix) (-=SKIPPED=-)
Last-Modified: Thu, 11 Oct 2001 16:52:40 GMT
Accept-Ranges: bytes
Content-Length: 46365
Connection: close
Content-Type: text/html

А вот с первой (динамика):


HTTP/1.1 200 OK
Date: Thu, 11 Oct 2001 20:59:13 GMT
Server: Apache/1.3.20 (Unix) (-=SKIPPED=-)
X-Powered-By: PHP/4.0.6
Connection: close
Content-Type: text/html

Ключевая строчка выделена. (но не видно , номер 4 сверху или 3 снизу).

Так что если захотят php определить - определят.

[This message has been edited by AiK (edited 12-10-2001).]

SS
На сайте с 31.08.2001
Offline
14
#15

<font face="Verdana" size="2">Originally posted by AiK:
А вот с первой (динамика):

HTTP/1.1 200 OK
Date: Thu, 11 Oct 2001 20:59:13 GMT
Server: Apache/1.3.20 (Unix) (-=SKIPPED=-)
X-Powered-By: PHP/4.0.6
Connection: close
Content-Type: text/html


Ключевая строчка выделена. (но не видно , номер 4 сверху или 3 снизу).
Так что если захотят php определить - определят.
</font>

Данное сообщение "лечится" установкой


expose_php=Off

в файле php.ini

P
На сайте с 31.08.2001
Offline
9
#16

Если я буду неправ, пусть меня поправят...

Насколько я смог понять, основная идея топика заключена в том, чтобы давать заведомо неправильный адрес, который в обработчике 404 ошибки хитрым образом преобразуется в нужный адрес через PHP скрипт и по нему загрузится нужная страница.

Но! Хочется спросить - а не будет это рассматриваться теми же поисковиками как редирект, со всеми вытекающими отсюда последствиями?

Или же такого рода редирект отследить у поисковиков мозгов пока не хватает?

P
На сайте с 31.08.2001
Offline
9
#17

Кстати, Александр, у меня к вам совет, как програмер программеру . Не стоит разбор всех запросов делать через файл ошибки 404 - просто если у вас на сайте будут передоваться данные с форм через метод POST, то есть вероятность, что во время генерирования ошибки 404 все данные из форм умрут. Если же все линки делать через конкретный файл, который и будет заниматься разбором адресных строк, то все будет нормально.

А по поводу того, что поисковики игнорируют расширение phtml или php как таковое, то мне неизвестно, что они начали войну против php как такового. Вот всякие хитрые символы в адресе, это да. А чтобы проводить геноцид только по расширению...

T
На сайте с 04.07.2001
Offline
17
tsv
#18

Обработка ошибки 404 - именно для приведения URL к "нормальному" (без знаков ?) виду, и для прописывания даты в заголовке HTTP.

Как показывает практика, такие тонкие признаки динамической страницы, как заголовки HTTP X-Powered-By, отсутствие поля Content-Length, не влияют на поисковики абсолютно. Точно так же, как и строка Server (которая вообще одинакова для всех документов, берущихся с сервера). В общем, их (поисковые системы) можно понять.

Допустим, на каком-либо большом сервере целиком, указано, что .html и .htm - парсятся PHP. Тогда нет вообще никакой возможности извне отличить страницы со вставками PHP от просто статических страниц. Которые при этом тоже проходят через парсер, но результат работы парсера совпадает с исходным скриптом.

То есть идея очень проста - поисковики не обращают внимания на эти поля и, скорее всего, не будут обращать, потому что они не являются достоверным признаком того, статическая это страница или динамическая.

Во внимание принимаются только явные ("ярко выраженные") признаки: наличие "?" в URL и поле Last-Modified в заголовке HTTP.

Кроме того, есть предположение (но это уже действительно просто предположение), что никакого влияния не имеет и расширение файла тоже.

Таким образом, если (на всякий случай ) сделать у документов сайта расширение .html, и обрабатывать ошибку 404, прописывая при этом код возврата "HTTP/1.1 200 ОК", и правильную дату Last-Modified, то поисковики должны индексировать такой сайт безо всякой "дискриминации". Что, в общем замечательно подтверждается на практике.

Что же касается POST-переменных, то они действительно "теряются" ... если не принять мер. Дело в том, что POST-переменные передаются в обработчик 404 ошибки, и их просто нужно самостоятельно передать "далее по цепочке". В качестве простейшей (применяемой мной) меры служит кусок кода, который работает внутри обработкика 404 ошибки, и просматривает содержимое HTTP_POST_VARS[], после чего просто добавляет их значения в виде GET-переменных в URL вызываемого скрипта, предварительно пройдясь по ним функцией rawurlencode().

Григорий Селезнев
На сайте с 25.09.2001
Offline
298
#19

Всем здрасте !!

Народ, есть еще более простой способ !!! Передавайте параметры через слеш !!!

Например ... /page.html/1 /page.html/2 /page.html/ivanov :-))

По моему опыту - просто на ура работает, но будьте готовы к тому, что поисковики будут генерить много запросов к Вашему серверу при его индексации ...

Григорий Селезнев
На сайте с 25.09.2001
Offline
298
#20

Вот немного моих рекомменаций по техническим особенностям :

http://www.be1.ru/articles/manual/technology.html

P.S. подпишитесь с главной страницы на новости ;-))

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий