Сбор ботов

Oshparennij
На сайте с 14.01.2008
Offline
174
819

Кто-нить, подскажите. где взять скриптик для сбора ботов гугла?

Продам базу email (usa), валид 99%. Пишите в личку.
V
На сайте с 05.08.2007
Offline
87
#1
Oshparennij:
Кто-нить, подскажите. где взять скриптик для сбора ботов гугла?

Что Вы имеете ввиду под "сбором ботов гугла"? Если хотите знать сколько раз и с какого ip у Вас был бот, то делаем, примерно, так:

cat access.log |grep Googlebot|cut -f 1 -d " " |uniq -c|sort -n

Если что другое, обьясните более подробно, пожалуйста.

---

С уважением, Victor (http://adm-lib.ru)
IL
На сайте с 20.04.2007
Offline
435
#2

VGrey, можно ведь без 'cat' =)

... :) Облачные серверы от RegRu - промокод 3F85-3D10-806D-7224 ( http://levik.info/regru )
Oshparennij
На сайте с 14.01.2008
Offline
174
#3
VGrey:
Что Вы имеете ввиду под "сбором ботов гугла"? Если хотите знать сколько раз и с какого ip у Вас был бот, то делаем, примерно, так:

cat access.log |grep Googlebot|cut -f 1 -d " " |uniq -c|sort -n



Если что другое, обьясните более подробно, пожалуйста.

---

Моя задача, отфильтроваю юзеров от ботов... Т.е. заходит бот... Скриптик записывает его в текстовый... Заходит еще один, скриптик дописывает....

Заходит юзер, скриптик ничего не пишет...

Но меня волнуют тока боты гугла...

DV
На сайте с 01.05.2010
Offline
644
#4

Oshparennij, вам дали строчку, вытаскивающую из лога нужную вам информацию. Добавьте в конце "> файлик.txt" и будет вам счастье.

VDS хостинг ( http://clck.ru/0u97l ) Нет нерешаемых задач ( https://searchengines.guru/ru/forum/806725 ) | Перенос сайтов на Drupal 7 с любых CMS. ( https://searchengines.guru/ru/forum/531842/page6#comment_10504844 )
Oshparennij
На сайте с 14.01.2008
Offline
174
#5

Ок... извините за вопрос конечно, а куда ее пихать? =)

И что куда еще добавть? про файлик.txt не понял

B
На сайте с 07.12.2009
Offline
42
#6

Вы сначала уточните язык, который знаете и на котором вам нужен это "скриптик"

neoks
На сайте с 17.03.2010
Offline
152
#7
Oshparennij:
Моя задача, отфильтроваю юзеров от ботов... Т.е. заходит бот... Скриптик записывает его в текстовый... Заходит еще один, скриптик дописывает....

Заходит юзер, скриптик ничего не пишет...

Но меня волнуют тока боты гугла...

просто блокировать доступ по шаблону "Google" более чем достаточно а если вам нужны логи заходом и IP адреса ботов то велком в логи nginx.

как то так, а там уже в зависимости от того считать сколько раз с одного IP, сортировать и т.д

из SSH соответственно или на крон поставить команду: cat /var/путь/файл.log | grep google | awk '{print $1}' >> /var/путь/файл.txt

SEoSashok
На сайте с 16.07.2012
Offline
25
#8

Oshparennij, Попробовал всего один единственный скрипт, вполне устраивает тыц

Oshparennij
На сайте с 14.01.2008
Offline
174
#9
SEoSashok:
Oshparennij, Попробовал всего один единственный скрипт, вполне устраивает тыц

Гуд... Спасибо!

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий