"фантомные" боты

12
realefs
На сайте с 27.06.2010
Offline
87
3758

периодически вижу на тдс переходы с юзерагентом

Mozilla/5.0 (Unknown; Linux x86_64) AppleWebKit/538.1 (KHTML, like Gecko) PhantomJS/2.1.1 Safari/538.1

так же видны множественные переходы на доры, которых еще или уже нет в индексе яндекса, с передачей поискового реферера яндекса (юзерагенты пробрасывают разные)

из общего у них :

юзерагенты разные ("реальные" а не "%bot_name%").

пробрасывают поисковый реферер (яндексовский. параметры в реферере меняются)

принимают/отдают куки

выполняют js (через js проверял разные параметры, например screen, возвращают данные нормально)

идут с айпишников детектящихся как пчелайн, корбина, etc (99% мск и область + из других мест. но возможно это базы геоайпи неправильно определяют)

на гоуфаке видел несколько человек отписывались с похожей симптоматикой.

вас такие боты долбят? как детектите?

Рубероид дорожает.
rasiell
На сайте с 16.02.2008
Offline
180
#1
Zerber (http://spartanets.ru/zerber) — программа для публикации статей в различные CMS и блогсервисы
realefs
На сайте с 27.06.2010
Offline
87
#2

серьезно? я читал что это за платформа. вопрос в другом, кто и как борется с ними

или сигой светануть очень надо было?

rasiell
На сайте с 16.02.2008
Offline
180
#3

например, для апача:

SetEnvIfNoCase User-Agent "PhantomJS" badbot

Deny from env=badbot

realefs
На сайте с 27.06.2010
Offline
87
#4
rasiell:
например, для апача:
realefs:

из общего у них небольшой пул юзерагентов

возможно я не очень понятно изложил. но этот момент указан в исходных данных. прокидывай они всегда один юзерагент, вопрос не поднимался бы

повторюсь,

юзерагенты разные ("реальные" а не "%bot_name%").

пробрасывают поисковый реферер (яндексовский. параметры в реферере меняются)

принимают/отдают куки

выполняют js (через js проверял разные параметры, например screen, возвращают данные нормально)

kxk
На сайте с 30.01.2005
Offline
970
kxk
#5

realefs, По слову phantomjs и linux последние тоже жлобы не 1 продажи на миллионе уников.

Ваш DEVOPS
HM
На сайте с 14.01.2012
Offline
223
#6
realefs:
вас такие боты долбят? как детектите?

Долбят, никак.

AK
На сайте с 23.02.2009
Offline
117
#7

Для nginx, yandex.com|ya.ru добавь туда в конфиг только.

=========

А блин, может и не подойдет. Надо писать более разветвленное правило. Как вариант, собрать их айпишники и блэк-лист.

realefs
На сайте с 27.06.2010
Offline
87
#8
ant_key:
Для nginx, yandex.com|ya.ru добавь туда в конфиг только.


=========

А блин, может и не подойдет. Надо писать более разветвленное правило. Как вариант, собрать их айпишники и блэк-лист.

и забыть о трафике с яндекса? для буржа это конечно выход

да, можно на ханипоте их собрать и банить по айпишникам, только есть некоторые сомнения по поводу происхождения адресов и возможного лишения части трафика.

так то от этих ботов ни холодно, ни жарко. только цифры на тдс засирают

bolyk
На сайте с 16.02.2006
Offline
175
#9

Можно взять листы спам(мусорных) ботов тут:

http://en.linuxreviews.org/HOWTO_stop_automated_spam-bots_using_.htaccess

https://github.com/bluedragonz/bad-bot-blocker/blob/master/.htaccess

Оставьте только нужные вам, остальные будут фильтроваться.

Thunder v3. Дорген (http://ifirestarter.ru/product/10) | MassSiteProxy. Скрипт клонирования сайтов (http://ifirestarter.ru/product/12) | CPAgen CPA дорген (http://ifirestarter.ru/product/14) | (http://fast-index.ru/article)
realefs
На сайте с 27.06.2010
Offline
87
#10

еще один топик не читай, сразу отвечай. ведь сига сама себя не оставит.

@bolyk, прочитай стартопик и после ответь, как твое сообщение поможет?

осталось только дождаться @vastamanager, который расскажет что в его чудодоргене такого не бывает.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий