Робот Yandex.Закладки не соблюдает robots.txt !?

M
На сайте с 25.01.2001
Offline
57
#61

wolf

У Вас что-то плохо с английским языком (может, это просто к концу рабочей недели?)

...by retrieving a document and recursively retrieving all documents that are referenced.

Т.е. обход ссылок - обязательное свойство.

Дальнейшее добавление по поводу рекурсивности же, скажем так, по-русски означает, что

a) Немедленная загрузка документов, на которые ссылается только что загруженный, не является обязательным свойством робота, т.е. можно и потом.

b) Робот может применять к ссылкам некоторые эвристики, в т.ч. не обязательно, на самом деле, даже засасывать все документы, на которые стоит ссылка в исходном.

euhenio
На сайте с 21.09.2001
Offline
357
#62
Теперь я прошу Вас и/или og высказать свое аргументированное мнение по поводу того, почему же Закладки, по вашему, обязаны следовать /robots.txt, причем без эмоций, поскольку это все-таки главный вопрос нашего обсуждения.

- а можно чужим влезть? :)

Придется повториться в третий раз, и расписать все подробно.

Есть инет-магазин, и в нем ввод заказа в форму с кнопкой, которая оформляет заказ и радостно выдает страницу с параметрами заказа (типа "заказ удался, вам выставлен счет с таким-то номером и тд, запомните его!"). Человеку лень это запоминать, и он заносит страницу в закладки. А надо сказать, что параметры по глупости пересылали методом get, и они в урле присутствуют, и в закладках эта страница появилась. Опять-же, кеширование было вечное у этой страницы, поэтому повторные заходы броузеров никого не беспокоили. А о поисковых системах не думали - они же в форму данные подставлять не умеют. Ну, на всякий случай закрыли robots.txt.

И что же? Вот вам и вред от вашего робота, многократно выполняющего скрипт. Ситуация придуманная, но более чем реальная. Каждый "заказ" ведет к затратам времени=денег на бессмысленное переругивание с бывшим заказчиком. Аргументы типа "можно анализировать заголовки" - не годятся, ибо создатели сайта ничего НЕ ОБЯЗАНЫ делать.

Упоминалась ситуация с проверкой ссылок в каталогах. Но в каталог страницы по доброй воле заносят, и не имеют против, если происходит проверка.

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
M
На сайте с 25.01.2001
Offline
57
#63

wolf

...Webopedia...

В стандарте robots.txt обсуждаются как-бы web-роботы, которые мешают спокойно жить web-мастерам.

M
На сайте с 25.01.2001
Offline
57
#64

euhenio

Во-первых, за 10 минут можно поправить скрипт так, чтобы после оформления заказа делался редирект 302 на страничку "заказ принят", с исходными параметрами.

Во-вторых, это что же получается, ID пользователя тоже параметром скрипта передается? А как же безопасность? Любой желающий из referer'а его узнает, и, будучи в веселом настроении, пойдет еще Вам что-нибудь закажет :). Такой магазин вообще не имеет права существовать (кстати, меня несколько мутит вообще от форм заказа без https).

euhenio
На сайте с 21.09.2001
Offline
357
#65
Во-первых, за 10 минут можно поправить скрипт так

-Ну так как, Яндекс берется за помощь всем, у кого эта проблема возникла? Бесплатно? :) Давайте договоримся, что свои проблемы они решать будут сами, а проблемы Яндекса пусть решает Яндекс.

Во-вторых, это что же получается, ID пользователя тоже параметром скрипта передается?

-передаются, например, Фио и контактные данные с пометкой "срочно перезвоните мне, и мы обсудим там чего-то". Это заказ, а не покупка - оплаты пока нет.

И все же, вред я показал. В данном случае Яндекс создаст проблемы этому сайту, при этом "все что могли" в плане robots.txt они сделали.

euhenio
На сайте с 21.09.2001
Offline
357
#66
Такой магазин вообще не имеет права существовать

-Скорее уж, не имеет право существовать робот Закладок :)

O
На сайте с 08.01.2002
Offline
157
og
#67
Как писал melkov
(кстати, меня несколько мутит вообще от форм заказа без https).

Однако Яндекс.Деньги на Озоне продаются без всяких https =)

Чтож не повлияли?

Кстати вы к сожалению так и не ответили по сути задачи.

Дело в том, что у многих хостеров как в России, так и на западе в

экономных планах просто нет возможности разместить свой .htaccess.

Тоесть вы рекомендуете подобным провайдерам забанить заходы

роботов Яндекса через фаэрвол?

Могу ли я ссылаться на данную вашу рекомендацию, как позицию Яндекса

по данному вопросу?

Пока мы живы, смерти нет. Когда придёт она, не будет нас.
W
На сайте с 10.03.2001
Offline
61
#68
Как писал og

Тоесть вы рекомендуете подобным провайдерам забанить заходы
роботов Яндекса через фаэрвол?

Вы с ума сошли ! Где я это говорил ? :)

Зачеркните немедленно !!!

В тексте предагались типичные скриптовые решения. Чем Вам не нравится идея запрещать нулевой реферер ? А более жесткая проверка на "правильный список" рефереров ?

wolf
На сайте с 13.03.2001
Offline
1183
#69
Дальнейшее добавление по поводу рекурсивности же, скажем так, по-русски означает, что
a) Немедленная загрузка документов, на которые ссылается только что загруженный, не является обязательным свойством робота, т.е. можно и потом.

Я бы интерпретировал немножко иначе:

а) Загрузка документов, на которые ссылается только что загруженный, не является обязательным свойством робота, т.е. можно и не загружать ни немедленно, ни потом.

b) Робот может применять к ссылкам некоторые эвристики, в т.ч. не обязательно, на самом деле, даже засасывать все документы, на которые стоит ссылка в исходном.

Вот-вот. не обязательно засасывать все документы, на которые стоит ссылка в исходном в частном случаем может иметь ситуацию не засасывать документы, на которые стоит ссылка в исходном.

Так что не надо грешить на мой английский.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
O
На сайте с 08.01.2002
Offline
157
og
#70


Вы с ума сошли ! Где я это говорил ? :)

Чуть выше по топику:

08-08- 2002 18:21

..А там, где владельцы сайтов против категорически, надо ставить файрвол или пароль...

Пароль поставить не получится, нет такого пункта на этом тарифе.

Да и провайдер преемлет только глобальные решения. Сделал и забыл.


Зачеркните немедленно !!!

Вы как нибудь определитесь =)


В тексте предагались типичные скриптовые решения. Чем Вам не нравится идея запрещать нулевой реферер ? А более жесткая проверка на "правильный список" рефереров ?

Хостинг простых страничек. $15 в год. Никаких CGI, никакого .htaccess.

Зато размер сайта до 150 мег.

Собственно занято мег 135 под html & немного image ..

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий