Cherny

Рейтинг
120
Регистрация
19.09.2001
Ну пусть пока ПР поднимется..

Это как употребление Виагры в одиночном походе по тайге в 100 км от ближайшего жилья :D

Гугл, зараза, стал игнорировать robots.txt и проиндексировал pdf файлы.

Можете привести здесь содержимое файла, инструкции которого проигнорировал Гугль?

А ссылку можно сделать например так:

<a href="#" onclick="document.location='/filepath/file.pdf'; return false">Test</a>

Если я не ошибаюсь, то в phpMyAdmin можно кодировку выбрать в формочке на первой странице.

Mona, Вы можете видеть крокозяблы еще потому, что кодировка данных в БД и кодировка интерфейса могут отличаться.

Так, расскажу, как я делал в свое время.

Для меня дата изменения документа имела значение только в разрезе ускорения индексации сайта с большим количеством страниц. Это когда еще у Яндекса была квота в 500 страниц с сайта за один раз.

Когда робот второй и последующие разы запрашивает уже известный ему документ, в запросе присутствует заголовок If-Modified-Since c датой, когда робот последний раз запрашивал этот документ. Если документ изменялся, я выдавал 200 Ok + Last-Modified с реальной датой изменения документа, если же документ не изменялся – выдавал 304 Not Modified и все.

В этом случае в результатах Яндекса для всех этих документов дата отображается. Сейчас, если много страниц индексировать не надо, то я даже с Last-Modified не заморачиваюсь.

ИМХО, робот на Last-Modified особого внимания и не обращает. А то дата изменения документа каждый раз свежая, а документ ни на байт не изменяется. Робот ведь тоже не совсем тупой!

:)

Ну почему у некоторых сайтов стоит дата в скобках, у других - нет?!

Для того, чтобы Яндекс в результатах поиска отображал дату для псевдостатических страниц, необходимо полностью эмулировать обработку дат в заголовках, как для полностью статических страниц. Одного Last-Modified недостаточно, еще If-Modified-Since в запросах следует учитывать.

[Oleg], перед GMT пробел надо добавить:

@header("Last-Modified: " . gmdate("D, d M Y H:i:s") . " GMT");

Miha,

@ зачем ???

чтобы не выдавалось сообщение в случае ошибки, например если делается попытка отправить заголовок, когда уже было отправлено тело документа.

soroka,

Как заставить Яндекс отображать дату последнего изменения страницы при выдаче?

Даже если выдавать Last-Modified дата в выдаче Яндекса не появится. У меня, по крайней мере, так было.

gilza, так неправильно, почитайте тему, где разработчики из Яндекса учавствуют.

Правильно так:

User-agent: *

Disallow:

User-agent: Yandex
Disallow:
Host: www.glavnoe-zerkalo.ru

С опозданием присоединяюсь к поздравлениям!

Желаю всего наилучшего!

Ждем еще в гости!

Использование секции для всех роботов, которая User-agent: *, в сочетании со всевозможными расширениями от разных поисковых систем, вроде Host: от Яндекса или Crawl-delay: от Yahoo, может приводить к непредсказуемым результатам.

Известно ведь, что Googlebot полагает секцию с директивой Host: неправильно оформленной и игнорирует ее.

P.S. А раздел помощи на Яндексе давно нуждается в ревизии, ИМХО.

Piotiger, исходя из правила, идет не перенаправление, а выдача 404 Not Found по адресу sait.ru/12, так что документ по этому адресу и индексироваться не будет, и из базы удалится, если ранее был проиндексирован.

А нельзя было без mod_rewrite обойтись, через ErrorDocument?

Всего: 1011