- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Стало быть, Илья Сегалович не знает, что творят его роботы, если он на robots.txt грешил? Что за бардак творится в Яндексе?
Я вот читаю эту х... эээ... дискуссию и думаю: почему бы борцам с Яндексом не пойти лучше и не докопаться до авторов различных email грабберов, что они не уважают robots.txt?
Так, мысли вслух 🙄
Нормально. Robots exclusion protocol не чувствителен к регистру.
А как кто, позвольте спросить?
Так, мысли вслух
Всему свое место. Данный форум вообще-то посвящен поисковым системам, а не email грабберам. Откуда Вы знаете, может в соответствующих местах борьба с последними ведется не менее активно. ;)
Да? Однако страница http://www.yandex.ru/addurl.html не запрещена для роботов файлом robots.txt. А в лицензии сказано только о запрете на атоматические запросы в поисковую систему, но ни слова о запрете на автоматическое добавление страниц в базу Яндекса. Кстати, автоматические добавлялки будут сродни вашему роботу D - в форму на специальной странице человек вводит свой URL, а автосабмиттер постит его в вашу форму (ну, и заодно, возможно, и в кучу других ;) ) - то есть это сервис, в котором пользователь явно просит обработать явно заданный URL и по вашему определению роботом не является.
Скачивать страницу и делать запрос по форме из этой страницы - это не одно и то же. Запрет должен распространяться не на адрес:
http://www.yandex.ru/addurl.html
а на адрес:
http://www.yandex.ru/cgi-bin/publicaddurl
На каковой он и распространяется:
http://www.yandex.ru/robots.txt
User-Agent: *
...
Disallow: /cgi-bin/
...
Так что формально мы ведем себя впоне корректно.
Вряд ли стоит вступать в дискуссию надо считать ли "автодобавлялки" роботами. Она довольно бесплодная. К тому же агрессивные автодобавлялки мы, конечно же, запрещаем.
Сам вопрос возник потому, что пользователи часто понимают robots.txt не как список запрещенных для автоматических агентов зон на своем сайте, а как отображение своего сайта в базе поисковых систем. Очевидно, что это не совсем одно и то же.
Впрочем, может быть стоит и нам трактовать robots.txt именно во втором смысле. Надо подумать на эту тему.
Илья
Программа wget, которая используется в юникс-системах для скачивания информации, имеет опцию рекурсивного скачивания. При этом она обрабатывет файл robots.txt после выгрузки индексного файла и составления списка загрузки, о чем явно написано в руководстве. Интересно как ведет себя в аналогичном случае Teleport под Windows?
Программа wget, которая используется в юникс-системах для скачивания информации, имеет опцию рекурсивного скачивания...
При чем тут рекурсивное скачивание?
Программа addurl (Yandex с флажком D) этим не занимается, он скачивает только 1 (_один_) URL, явно указанный _человеком_ в форме
Программа addurl (Yandex с флажком D) этим не занимается, он скачивает только 1 (_один_) URL, явно указанный _человеком_ в форме
В данном случае я не имел в виду какого-либо робота Яндекса, а просто привел пример программы, нарушающей в своей работе Robots Exclusion Standard, что имеет некоторое отношение к данной теме. Если неправ, прошу прощение за оффтопик.