MaxB

MaxB
Рейтинг
110
Регистрация
29.04.2003

InSAn, ОГРОМНЕЙШЕЕ спасибо!

Думаю, что и совет про урлы тоже учту :)

Как писал matik
MaxB, гы а как его узнать :)

Приблизительно можно при помощи Google бара (Google's Page Rank)

Как писал Scaramush


Накидай ссылок на новые страницы с какого-нибудь бесплатного хостинга.
Может помочь...
А заставить робота что-то забрать у тебя никак не получится.

Поможет только если ссылки будут находиться на страницах с большим ВИЦ.

Как писал Cherny

Не будут, если кроме даты обрабатывать заголовок запроса If-Modified-Since, если же просто выдавать дату и "200 Ок", то робот все равно будет забирать документы.

Не всегда.

А можно подробнее как формировать If-Modified-Since 😕

Ну и какой резон от этого?

Я ведь хочу, чтобы робот видел, что некоторые страницы не изменяли контент со времени прошлой индексации. А так что изменится -ничего.

Цитата из http://www.yandex.ru/addurl.html

Поисковая машина yandex.ru предназначена для работы с "русскоязычным" интернетом. Поэтому просим вас добавлять сервера, содержащие тексты на русском языке и/или имеющие отношение к России.

Как писал MASe
оффтопик
а можно вообще блокировать скачивание сайта??? (телепортом, гетом, вебзипом)?

От простых идиотов можно защититься если прописать в конфиге апача строки при включенном модуле mod_rewrite:

RewriteCond %{HTTP_USER_AGENT} ^Teleport

RewriteCond %{HTTP_USER_AGENT} ^Wget

RewriteRule ^.*$ - [F]

Апач просто будет блокировать доступ для юзер агентов Teleport и Wget. Но более-меннее умный человек возьмет и изменит название своего агента. И строки становятся бесполезными.

А вообще есть методы анализа траффика на схожесть GET запросов по временнному интервалу с блоком по IP (т.е. попытка выявить аномальное поведение юзера, но при этом нельзя забывать, что к Вам приходят и поисковики).

Как мне кажется, самый простой метод- это тот, который я описал в начале.

Как писал Interitus

(сервис-пак от WinXP вполне подходит для подобной цели).

Я представляю на сколько денег ежедневно попадает Майкрософт :)

Interitus спасибо за совет.

Да все верно, не попадает в индекс. К сожалению я сейчас не могу вспомнить пример на котором я убеждался в моей версии. Мой пример был на PHP, но это разве имеет какое-то значение. Он был точно по такой же схеме, и линк засчитался.

Мой опыт показывает, что именно Яндекс возьмет, другие нет.

Яндекс умеет брать линки из скриптов с внешней передачей данных.

Не умеет из явы с внутренней передачей данных.

У Вас на лицо внешняя передача, линк виден прямо в строке.

Я бы сказал, что Яндекс его возьмет, но возможно я ошибаюсь основываясь только на своем опыте.

Всего: 200