Webalta выходит на арену

FlyAway
На сайте с 01.06.2005
Offline
439
#291

Алексей, кстати киньте урл для захода в вебальтовский директ) я б ещё объявлений пописал бы ;)

Сердюченко Андрей (http://www.serdyuchenko.ru/) Масонская ложа — SЕ-Team.ru (http://goo.gl/YIjV6h) :)
M
На сайте с 29.03.2003
Offline
65
#292
Алексей Гурешов:
Грыбочек, а Вы не думали что большим сайтам вообще чхать на бота? Его несколько тысяч даже если десятков тысяч хитов никто не замечает.

Я бы не назвал wikipedia.org мелким сайтом, но все боты, не понимающие crawl-delay, им банятся, не взирая на ранги. Эт у них в полиси прописано. Как я понимаю, Вебальта эту команду не разумеет.

Проверь свои запросы: Вершки Рунета (http://www.43n39e.ru/)
АГ
На сайте с 11.11.2005
Offline
21
#293
M
На сайте с 03.11.2004
Offline
94
#294

выдача уже вручную модерируется?

АГ
На сайте с 11.11.2005
Offline
21
#295
motorhead:
выдача уже вручную модерируется?

что значит вручную? дорвеи баним, но пока не так активно как хотелось бы. Щас дописывается система управления - там в один клик будет.

M
На сайте с 03.11.2004
Offline
94
#296

просто слегка удивил такой результат

M
На сайте с 29.03.2003
Offline
65
#297
Алексей Гурешов:
http://www.webalta.ru/search?q=site%3Aen.wikipedia.org

вопросы?

Ха-ха, рассмешили :) Логика вас тут подвела. Эта выдача доказывает, что вы википедию идексировали, и судя по всему до 7 июля, - насколько осилил листание, сначала шли страницы с датой изменения 7 июля, потом 6 июля, потом пошло 5-е... Никаких подтверждений, что вас не забанили, или не забанят, пока не начнёте соблюдать crawl-delay это не даёт ):D

Вы админам сайта отпишите, так мол и так, мы crawl-delay не поддерживаем, но вас идексить будем, несмотря на ваше полиси - любой нормальный сайт должен это выдеражать. Вот на ответ я бы хотел посмотреть :)

АГ
На сайте с 11.11.2005
Offline
21
#298

Я терпеливый, но сил больше нет... 14тысяч страниц за 7 дней скачено, по 2тысячи хитов в сутки, так как я и говорил раньше про максимум в сутки.

Потыкай на 500-600тый результат... там будет и даты прошлого месяца, что тебе не понятно-то? Морду вытянули 5ого июля, википедия внесена в список начального обхода, так же как и 311тысяч сайтов других, втечении двух дней обошли все ссылки с морды и остановились с более свежими изменениями.

Быстрого индекса пока нет, поэтому все верно. Знаешь складывается ощущение что ты вообще не понимаешь о чем говоришь, из серии лишь бы сп$днуть ;)

Могу кинуть логи если хочешь, у википедии все ответы нашему боту 200тые с контентом.

PS. Предлагаю модераторам закрыть ветку, потому как топик становится уже не читаемый.

АГ
На сайте с 11.11.2005
Offline
21
#299

Кстати, щас глянул, на википедии 1,2млн статей, гугл показывает 211млн страниц с нее (что само по себе фигня полная), как ты себе представляешь индексациюю 211млн страниц за месяц к примеру не напрягая сервер? или за 3 месяца?

M
На сайте с 29.03.2003
Offline
65
#300

Доройгой Алексей, вы сейчас похожи на юнца, матерящегося в публичном месте для ощущений собственной крутости и утвержавшего, вот я тут с малолетки денжат стряс - видите, меня не поймали, значит за грабёж не сажают :)

Прочтите лучше этот документ, он ответит на все ваши вопросы:

http://en.wikipedia.org/wiki/Wikipedia:Bots

И в http://en.wikipedia.org/robots.txt есть комментарий:


Please note: There are a lot of pages on this site, and there are
some misbehaved spiders out there that go _way_ too fast. If you're
irresponsible, your access to the site may be blocked.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий