Разработчикам Webalta, перестаньте досить :)

[Удален]
#11
Radionov:
Мда... уважения такие посты не добавляют.

Я слежу за вашими сообщениями с самого, так сказать, начала вашей деятельности, и в последнее время все больше убеждаюсь, что кроме наглости и хамства у вебальты пока ничего нет.

Помоему он прав. Если бот мешает - проще сказать, чтобы его закрыли,.

Если у человека более 100тысяч уникальных урлов на домене и при попытке закачать 3тысячи в сутки сервер падает - в топку такой сервер.

Даже за 1 месяц не проверить работоспособность каждого урла.

[Удален]
#12

Я слежу за вашими сообщениями с самого, так сказать, начала вашей деятельности, и в последнее время все больше убеждаюсь, что кроме наглости и хамства у вебальты пока ничего нет.

прав .прав.. вебальту в топпку!😡

АГ
На сайте с 11.11.2005
Offline
21
#13
sun:

Я конечно понимаю чтобы составить конкуренцию большим поисковикам нужно иметь, что то особенное типа самой большой базы и т.д., но не такими же средствами. Можно ли настроить чтобы бот ходил не так жестко, а по мягче.

А еще не считайте что страниц 60к, их намного больше получится, превью статей, постраничный вывод тем самым страниц получается как минимум в два раза больше.

Этот сайт я привел как пример, на самом деле ситуация такая на многих сайтах.

Знаете, глупо сравнивать в прицнипе, как по идеологии, так и по принципу работы. Вебальта первоначально планировалась так, чтобы период обновления основной базы был 14 дней, со временем увеличен возможно будет до 30 дней. За это время мы хотим успеть проверить работоспособность ссылок, изменения на сайтах и так далее.

Апорт кушает в сутки 60гиг htmlов (из интервью с Апортом), Вебальта кушает 1900гиг сейчас. Разница в 30 раз. Если Вы не хотите чтобы Все ваши страницы были в индексе - пожалуйста закройте или скажите нам, мы не будем пытаться их скачать, или закройте просто через robots.txt мы будем индексировать ваш сайт как апорт - только морды + немного внутрь.

PS. В принципе порядочный вебмастер должен радоваться тому, что все страницы его сайта проиндексированы и доступны для поиска. Говорить об отношении проиндексированно/кол-во трафика пока в принципе раньше осени бессмысленно.

АГ
На сайте с 11.11.2005
Offline
21
#14
Kost:
просто наверное не надо стремиться высосать их за день или два, а то активность робота вебальты вызывает недоумение. Должно быть ограничение на количество документов в минуту, пауза между последовательными скачиваниями с одного сайта (хотя бы пару секунд), только и всего.
С другой стороны лимит на 3к запросов в сутки - это действительно глупо.

100тысяч страниц у него на сайте, объясните мне, сколько высасывать в день, чтобы за 2 недели их проиндексировать?

АГ
На сайте с 11.11.2005
Offline
21
#15
Radionov:
Мда... уважения такие посты не добавляют.

Я слежу за вашими сообщениями с самого, так сказать, начала вашей деятельности, и в последнее время все больше убеждаюсь, что кроме наглости и хамства у вебальты пока ничего нет.

Причем тут наглость или хамство? Тут скорее мы ему нужны чем он нам, даже при том, что трафика с Вебальты пока кот наплакал.

Или Вам кажется что нам страничек не хватит?

Или может быть вам кажется что стучаться в закрытую дверь лучше, чем просто не тратить машинное время ни его ни наше на то, чтобы каждый раз пытаться его индексировать?

K
На сайте с 31.01.2001
Offline
737
#16
Алексей Гурешов:
100тысяч страниц у него на сайте, объясните мне, сколько высасывать в день, чтобы за 2 недели их проиндексировать?

по 7 тысяч в сутки, это примерно 1 запрос в 12 секунд. Но полностью проиндексировать такой сайт за 2 недели - это просто подарок, вероятно, это - лишнее.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
АГ
На сайте с 11.11.2005
Offline
21
#17
Kost:
по 7 тысяч в сутки, это примерно 1 запрос в 12 секунд. Но полностью проиндексировать такой сайт за 2 недели - это просто подарок, вероятно, это - лишнее.

И какие выводы? Про 3тысячи в сутки или 1 запрос в 30 секунд?

K
На сайте с 31.01.2001
Offline
737
#18

Почему "или"? "И". Ведь если запустить 3 тысячи запросов в минуту, а потом отдыхать сутки, сайт ляжет. Вам там наверное проще посчитать первую цифру?

АГ
На сайте с 11.11.2005
Offline
21
#19
Kost:
Почему "или"? "И". Ведь если запустить 3 тысячи запросов в минуту, а потом отдыхать сутки, сайт ляжет. Вам там наверное проще посчитать первую цифру?

См выше, 2 запроса в минуту мы ему делаем.

PS. Вообще надоело, как горох об стенку, баньте бота и все.

Gordon01
На сайте с 21.05.2006
Offline
12
#20
Напишите в /robots.txt:

User-agent: Webalta
Disallow: /

Люди, не сходите с ума

User-agent: Webalta
Crawl-delay: 5

Значение установите самостоятельно, но это, я думаю, будет ОК

Проблемы с сервером? Не та кодировка в MySQL? 404? Настройка VPS/VDS (forum.searchengines.ru/showthread.php?t=69437)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий