Евгений Крупченко

Евгений Крупченко
Рейтинг
178
Регистрация
27.09.2003
Интересы
хостинг без тормозов
Как писал mnt


вот у меня примерно так.

$intgmt=<текущая дата документа на свое усмотрение>;
$headers = getallheaders();
$gmt_source=$headers['If-Modified-Since'];
$intgmt_source=strtotime($gmt_source);
if($gmt_source&&!$show_first_page&&$ps_crawler)
//первую страницу всегда переиндексируем!!!, чтоб забирал новые линки
{
//здесь можно писать лог
//
if($intgmt<=$intgmt_source)
{
//тут тоже
header("HTTP/1.0 304 Not Modified");
exit;
}
}
header("Expires: 0");
header("Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0");
header("Pragma: no-cache");
header("Last-Modified: $gmt");//$gmt преобразованый в gmt $intgmt
header("Content-Type: text/html; charset=windows-1251");

ок, а теперь обо всем по-порядку:

1. на серваке php запускается не как модуль апача и поэтому не пашет функция getallheaders()

можно что-нть придумать, как-нть обойти это?

насколько важно это If-Modified-Since ? если его всеже не обрабатывать, на чем это скажется? причем я не гонюсь за индексацией именно динамики (т.е. урлов вида page.php?var=val&var1=val1), все урлы будут нормальные (типа domain.com/cat/), мне нужно чтоб страница переиндексировалась желательно каждый день, чтобы "проглатывались" линки с этой страницы и чтоб все страницы хорошо индексировались.

2. если я сделаю чтоб Last-Modified было всегда на час меньше, чем сейчас, это нормально будет? в смысле не будет ли это "подозрительно" ? подразумевается что сама страница естественно будет меняться достаточно редко. или может стоит сделать, чтоб размер файла тоже менялся (случайно например) при каждом обращении? в смысле не будет ли подозрительно что дата модификации постоянно меняется, а размер и содержимое файла нет?

3. изза вышеуказанной проблеммы с php, остаются следующие заголовки:

header("Expires: 0");

header("Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0");

header("Pragma: no-cache");

header("Last-Modified: ".gmdate("D, M d Y H:i:s",time()-3600)." GMT");

header("Content-Type: text/html; charset=windows-1251");

нормально так будет?

4. а что если страница полностью или по-большей части на англ. языке? какую тогда кодировку лучше ставить вместо windows-1251 ?

5. что такое header("Expires: 0") ? зачем?

nevermind...

Как писал mnt
вы и в самом деле думаете, что сделав только это, ваши сайты будут лучше индексироваться? :) нет и еще раз нет, будут индексироваться как и раньше поисковиками yandex, google, rambler, fast :) т.е основным поисковикам это побарабану.
АБСОЛЮТНО ВАЖНЕЕ отдавать ласт модифай, кодировку и корректно обрабатывать иф модифиед сайнс и будет тебе радость от индексации :)

а подробнее можно?

можешь подсказать, если не секрет, как правильно делать нужно для хорошей индексации?

я сейчас делаю заголовки php и meta такие:

<?

header("last-modified: ".gmdate("D, M d Y H:i:s",filemtime("index.php"))." GMT");

header("pragma: no-cache");

header("cache-control: no-cache, must-revalidate");

?>

<meta name="robots" content="index,follow,noarchive"> - или просто all, в зависимости от страницы.

<meta http-equiv="last-modified" content="<?=gmdate("D, M d Y H:i:s",filemtime("index.php"))." GMT"?>">

что еще нужно? что насчет кодировки и иф модифиед сайнс?

и может last-modified я зря в php хидере и в meta вставляю (в смысле достаточно может только в header'e)?

Всего: 623