Комментарии - Cherny - Профиль вебмастера - Форум об интернет-маркетинге

Запрет индексации 1-й страницы посредством robots.txt

9 сентября 2002, 11:14

При запрете индексации страниц сайта, Гугл все равно показывает ссылки на эти страницы без каких-либо описаний. Можно предположить, что робот проверяет существование страницы. Таким образом, просто сравнив размеры файлов, например, можно натравливать робота-зеркальщика.

Запрет индексации 1-й страницы посредством robots.txt

9 сентября 2002, 10:44

Ошибочка вышла. Между словами User и Agent необходим дефис.

Извиняюсь, прозевал.

нет, если главная страница это ввв домен ру, то Disallow: /index.html - бесполезен, не проще meta прописать?

Вопрос был о запрете индексации одной страницы. Пример получился неудачный. Пусть будет так:


User-Agent: *

Disallow: /news.html

А вот как будут вести себя роботы, если написать index.html, а ссылки есть как www.domain.ru, так и www.domain.ru/index.html?

Запрет индексации 1-й страницы посредством robots.txt

9 сентября 2002, 09:07

Как писал Kokoc
Возможно ли запретить индексацию одной страницы посредством robots.txt?

IMHO, можно написать примерно так:


UserAgent: *

Disallow: /index.html

При этом страница index.html индексироваться не будет, а все остальное вполне нормально проиндексируется.

Aport глючит?

9 сентября 2002, 06:15

Как писал groul
При попытке зарегистрировать сайт в каталоге Апорта (страница http://catalog.aport.ru/rus/reg/add.ple), выдается сообщение:

=====================
ОШИБКА!
403 Access Forbidden
=====================

Какие идеи?

Все нормально уже. Может утром исправили?

Люди, поделитесь плиз Ip Яндекса, Рамблера и Апорта

8 сентября 2002, 07:52

Как писал Piglet
Нигде не смог найти. Помогите пожалуйста.

На этом форуме целый топик посвящен именно IP роботов, если вы роботов имели в виду ;-)

Программа для определения %-го содержания...для конкретной Se

5 сентября 2002, 19:39

Как писал AnnaP
Здравствуйте, хочу создать программку, а вдруг такая уже есть и я зря буду мучаться?

Посмотрите ветку эту форума, домашняя страница здесь.

Определение места сайта в поисковиках Inktomi

5 сентября 2002, 19:29

Как писал pelmen
А какой User Agent у Look Smart-овского бота?

Looksmart - каталог.

Но некоторое время назад они купили WizeNut, бот которого идентифицирует себя так: Mozilla/4.0 compatible ZyBorg/1.0 (wn.zyborg@looksmart.net; http://www.WISEnutbot.com)

Дата в гугле

2 сентября 2002, 16:03

Как писал Space
В любом случае - как можно узнать (кроме изучения логов) когда робот последний раз прошелся по сайту.

Можно использовать простой текстовый счетчик на Perl либо PHP.

Дата в гугле

2 сентября 2002, 15:59

Как писал Kost
Разве в Яндексе показывается не дата последнего изменения документа (заголовок Last-Modified, выданный сервером роботу про последней (пере)индексации) ? Это совсем не дата включения в индекс. А если сервер такой заголовок не выдает (или выдает сиюминутную дату), то никакой даты не показывается вообще.

И в Яндексе и в Рамблере показывается дата последнего изменения документа, которую выдает сервер в Last-Modified. Если сервер выдает текущую дату в Last-Modified, то она и отображается как дата последнего изменения и совпадает с датой посещения страницы роботом. Если сервер такой заголовок не выдает, то никакая дата не отображается ИМХО.

Сколько страниц проиндексированно.

22 августа 2002, 04:00

sitename site:www.sitename.com

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах

Переиграть и победить: как анализировать конкурентов для продвижения сайта

Cherny