Вебальта работает или нет?

minaton
На сайте с 18.09.2004
Offline
135
1466

На Вебпланете висит баннер - "спонсор раздела Вебальта".

Сама Вебальта вроде функционирует, правда глюк с переносом русской кодировки на домене webalta.ru остался...

Когда официальный запуск? ;)

Artisan
На сайте с 04.03.2005
Offline
354
#1

Робот в логах отмечается, причем похоже что для начала они взяли dmoz базу сайтов, ...

www.leak.info / ДАРОМ линки конкурентов и забытых доменов
pelvis
На сайте с 01.09.2005
Offline
345
#2

Разрешите поддержать топикстартера?!

Продаю вывески. Задарма и задорого (https://www.ledsvetzavod.ru/)
minaton
На сайте с 18.09.2004
Offline
135
#3

Оказывается с 1 марта идет бета-тестирование http://www.webalta.net/ru/news.html

Пока есть некоторые мелки баги и выдача не совсем приглажена.

Есть одна фича - дополнительно показывать первую ссылку из тех, которые "еще с этого сайта". Хотя "дополнительно с сайта" не работает.

OC
На сайте с 18.07.2005
Offline
68
#4

Вчера (15 апреля) Вебальта указывала проиндексировано - 0 документов. Зато 2 недели робот ходит на сайт каждый день и жрет документы пока не лопнет - у меня всего 8 Мб информации на сайте, а он по логам умудрился уже 34 Мб слопать. Получается что он ходит по кругу??? У меня есть предположение, что он иногда создает проблемы для других пользователей в моменты "приема пищи" ...

K
На сайте с 31.01.2001
Offline
737
#5

Приходит, жрет трафик, портит статистику.

В robots.txt пробовал написать:

User-agent: WebAlta

Disallow: /

не помогает.

User-agent его такой:

WebAlta Crawler/1.3.4 (http://www.webalta.ru/bot.html)

а указанная страница не существует.

Вы не находите, что такое поведение довольно бесцеремонно?

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
OC
На сайте с 18.07.2005
Offline
68
#6

Если сильно достает, можно в .htaccess прописать

Deny From 85.21.193.107

(это ip их паука crawl-ru-85-21-193-107.webaltabot.com)

Лично я так сделал, т.к. считаю что дважды в день полностью обходить мой сайт - хамство, или другими словами - паразитная нагрузка на сервер.

А до роботс.тхт ему похоже действительно побоку - зашел, прочитал - и пошел дальше с новой силой.

Если им надо потренироваться- пусть делают свои сайты и на них тренируются.

OC
На сайте с 18.07.2005
Offline
68
#7

Все, замочил паразита :)

в 13:55 - бот последний раз зашел, 5 разочков башкой об 403 ответ постучался и канул

K
На сайте с 31.01.2001
Offline
737
#8
ORIC:
85.21.193.107

Еще замечены следующие IP-адреса:

85.21.193.106

85.21.196.180

85.21.196.181

85.21.201.54

85.21.201.55

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий