Cherny

Рейтинг
120
Регистрация
19.09.2001
Все же почему у index.php ПР=0?

Потому что для Гугля адреса / и /index.php -- разные, хотя с вашей точки зрения это одно и то же. PR расчитывается для каждого адреса в отдельности. Много страниц ссылается на /index.php? Скорее всего немного...

Григорий, поздравляю с сыном!

Чтобы рос родителям в радость.

На этой неделе своего показывали врачу, так врач говорит: "С мальчиками сложно -- сначала у них болят животики, потом режутся зубки, потом они простужаются, потом женятся!" :)

ведь не может же быть у браузера сразу несколько языков устоновленых по умолчанию

Зайдите в настройки любого браузера и добавьте столько языков, сколько Вам нужно. Вся фишка в том, что отдавать тем роботам, у которых нет заголовка Accept-Language.

Из заголовка запроса индексирующего робота Яндекса:

Accept-Language: ru, uk, be, en, *;q=0.01

В запросах роботов Рамблера и Апорта такого заголовка нет.

Как влияет на индексацию Идентификатор сессии в PHP, не спрятанный в куки, а вылезающий прямо в строку броузера?

Плохо влияет, естественно, здесь описывалось неоднократно. Яндекс запрашивает одну и ту же страницу с разными идентификаторами сессий и забивает такими копиями свою базу, в результате:

1. плохо индексируются новые страницы, потому что Яндекс проверяет старые с разными идентификаторами сессий.

2. Из-за такого количества страниц в базе очень плохо работают внешние факторы, страницы просто не "накапливают" вИЦ, PR и т.д.

3. после определенного количества дублей одних и тех же страниц в базе "включается" механизм удаления дублей, после работы которого в базе вообще может не остаться ни одной страницы.

Добавление идентификатора сессии в URL достаточно просто отключается в файле конфигурации PHP, в своих скриптах можно делать проверку User-agent и просто не стартовать для робота сессий.

теперь выдает это
Content-Type: text/html; charset=windows-1251
посмотрим что дальше будет

Дальше должно быть все нормально, после очередной переиндексации страницы, скорее всего, попадут в базу.

Интересна реакция браузеров на заголовок text/plain -- IE, например, определяет, что документ html и отображает его соответственно, а вот старый Netscape 4-й версии руководствовался ответом сервера и выдавал страницу, как текст, со всеми тегами в явном виде.

Анонс на главной, AFAIK, брался из RSS-фида. Используйте непосредственно RSS, чтобы смотреть свежие темы.

Можно даже у себя на сайте такой анонс вешать. ;)

Будет выводить в основной выдаче, я например именно в Гугле нахожу feed с новостями этого сайта, адрес которого все время забываю:

http://www.google.com/search?hl=en&lr=&ie=UTF-8&q=site%3Awww.searchengines.ru+news.rdf

ага и боты тоже в отпуск ушли

Неправда, роботы трудятся в поте лица, пока, правда, вхолостую. Ждем-с...

icechel, Вы несколько непоследовательны -- сначала надо выдавать дату для SSI, а оказывается, что SSI совсем не работает...

ОС: WinXP
WEB-SERVER: Apache 1.3.29
HTML через SSI выключен
в .htaccess прописано XBitHack full

У вашего хостера связка WinXP+Apache 1.3.29 или Вы на локальной машине проверяете?

Всего: 1011