юни

юни
Рейтинг
945
Регистрация
01.11.2005
Это Вам в саппорте ответили? Или опять обманываете?
alaev #:
Это к тому, что оттуда людей можно ждать, а не ботов?

Компания собирает данные для какого-то своего проекта, устаревший агент можно объяснить неразберихой после слияний и перестановок.

Проще всего, конечно, написать на контактный емейл с просьбой разъяснить, что это за краулер и почему он так странно представляется. Вместо этого автор темы предпочитает вопли и домыслы.

Ну, хозяин - барин. Главное, чтобы остальные поняли, о чём идёт речь.

Не знаю, что такое шапка темы. У темы есть название и первое сообщение. Ни там, ни там точная информация не указана - указана ссылка на агента и Ваши многочисленные фантазии на счёт подделок, нагло под видом и прочие домыслы.

В общем, обманывать нехорошо.

Только ссылка неточная. Точная вот эта.
Delysid #:
к хостингу  M100 LLC

Это датацентр, а не хостинг. И далеко не Битерики. Вы же умный. Про LLC знаете. А тут и того проще.

Александр #:
кто я такой
Да и я. Да и все.
Александр #:
Это mail / vk парсит и только с этого ДЦ.

Бедняга не понимает, что перед ним не Битерика какая-нибудь, а огромный холдинг. Кроме прочего, и пиринговый центр, и мобильный оператор, и всё на свете. А тут увидел слово "хостинг", на него сработал рефлекс.

Ничего, жизнь научит.

Amigo_9876 :
А как у вас, гении?

Дело не в гениальности, а в работе определённых участков коры головного мозга. У Вас они, видимо, развиты не так сильно.

И в любом случае для работы воображения нужна база. Чем больше и ярче, тем лучше.

Vladimirus #:
И с криптой будет так же
Крипта немного отличается от киви с вебманями. Немного, но в самой основе.
alaev #:
Но я понимаю, что хочется дешево и сердито, т.е. чтобы вы им сразу уронили все сервера.
Странный вывод. Никто никого ронять не хочет - напротив, и Озону, и Яндексу, и остальным парсеры желают счастья и процветания. Ведь они приносят деньги.
alaev #:
Если ваша промышленность будет рентабельна при более дорогом парсинге с меньшими нагрузками, то они вам начнут кидать капчу, как это делают яндекс или гугл.

Капча зависит не от рентабельности, а от технической реализации защиты. Кто, что и по каким критериям считает высокой или критической нагрузкой.

Понятно, что всё упирается в деньги в конечном итоге. Но взаимосвязь здесь не такая непосредственная, как кажется.

alaev #:
Ваш парсинг требует много дополнительных серверов.

Это тоже вопрос архитектуры. К примеру, для такой нагрузки требуется всего пара-тройка не самых сильных машин:


Имеются в виду пиковые значения(справа вверху).

Delysid #:
Я уже убеждён, что всё правильно делаю
Чудесно.
Всего: 35164