Romka_Kharkov

Romka_Kharkov
Рейтинг
485
Регистрация
08.04.2009
Должность
Хостинг
Качественный хостинг
JabbaHutt:
Нужно захостить примерно 50 млн статичных хтмл страничек (примерно 200гб). Посещалка 10к дейли, посещаются все более-менее равномерно. Вопрос - на какие характеристики сервера обратить внимание в первую очередь для ускорения открытия страниц? Как я понимаю цпу тут не поможет, RAM тоже, т.к. все не закешируешь, остается СДД вместо HDD? Я прав?

Большая ли разница будет при открытии страницы в 30кб на хдд и сдд?
Если конкретно, то выбираю из ассортимента SyS.
http://www.soyoustart.com/ie/essential-servers/

Я могу предложить вам услуги балансировки трафика для статических сайтов то, что будет нужно, вовсе не обязательно брать супер мега шустрый сервер с супер скоростными винтами и рейд массивами, можно взять множество дешевых серверов и разделить между ними нагрузку, при этом появляется рад плюсов, во первых, отказоустойчивость, при выходе из строя одного из серверов фермы, ничего не ломается, нагрузка просто расползается на оставшиеся, появляется дублирование\зеркалирование данных, а так же самое приятное, появляется отличная возможность масштабирования вашего проекта, т.е если завтра у вас станет 150 млн. статических страниц либо же появится большее количество посетителей, надо будет добавить пару серверов в ферму и синхронизировать данные.....

Готовы обсудить с вами возможность внедрения, а так же стоимость в личном порядке.

lhoster:
😂 Если Вам накидаю ссылок для заказа, модератор посчитает это СПАМом. Хетнзер не Хетзнер, сейчас таких лаукост решений полно, в разных локациях.

Вы сами попросили критики и обсудить, почему не берут. Я Вам высказал одно из явных предположений, отсутствия продаж у Вас... Не обижайтесь и не грубите. :)

Странно, я предлагаю сервера в Канаде, а вы говорите мне об Украине ....

Я не грубил вам... я в Китае думаю можно взять и дешевле того, что есть у вас в Украине... только причем тут это? Локация играет определяющие вещи в том числе и в ценообразовании на товар. А критика это хорошо, только как бы уместная нужна... а не из серии "воооон смотрите, там на ценнике написано дешевле".

lhoster:
Цена этим конфигурациям 60$ - 40$ - 40$, с нормальным неограниченным 100 Мбит/с каналом.

Вы бы еще пентиумы по 100$ предложили :)

Откуда ценообразование? Ваше желание? или хетзнера перекушали?

Romka_Kharkov:

  • Intel(R) Core(TM) i7-2600K CPU @ 3.40GHz / 16 GB RAM / 2x 750 GB HDD - 150$ / месяц.
  • Intel(R) Core(TM) i3-2120 CPU @ 3.30GHz / 16 GB RAM / 64 GB SSD - 100$ / месяц.
  • Intel(R) Core(TM) i5-3330 CPU @ 3.00GHz / 16 GB RAM / 64 GB SSD - 100$ / месяц.

Дорого ? или что ? Почему нет желающих и сервера не разбираете?

Давайте обсудим... ☝

Alех:
Рациональнее ли этот способ? Отнюдь нет.

Ну, видимо вы считаете что 1.000.000 запросов в секунду с одного ИП это рационально :)

Удачи, что еще сказать :)

---------- Добавлено 20.03.2015 в 00:32 ----------

dlyanachalas:
Я всё осознал. А вот вы почему-то отказываетесь осознавать, что весь антиспамовский софт сейчас настроен на ipv4.

Да ну не смешите, даже у меня в домашнем роутере уже давно ip6tables настроен так как надо, а вы говорите про масштабных регистраторов, там где уже внедрено нативное ipv6 сто процентов используются и фильтры и банилки для ipv6 и все что вы хотите... В общем зачем угадывать, попробуйте, результат сам за себя скажет.

---------- Добавлено 20.03.2015 в 02:04 ----------

Alех:
148,246,180, т.е. почти 150 миллионов

Ну вот, за пол года не напрягаясь можно собрать по 30 mln в месяц...

При наличии 1000 хостов разных.

Subudayj:
Гугл банит сразу /64 :)
Можно получить много ipv6 tunnel, и парсить через них - но это для особо упорных.

Проблема парсеров как и брутфорсеров заключается в том, что люди желают сделать 1.000.000 запросов в секунду, наивно полагая, что количество запросов регулируется только ихними серверами и количеством адресов :))) Основной принцип "приостановить" перебор, что бы парсящей стороне было не выгодно.... собственно все... По этому парсеры должны работать от обратного, они не должны делать 1.000.000 запросов с 1го ИП, они должны делать по одному запросу с 1.000.000 ИП :) Только тогда будет достигнут необходимый результат....

Предположим , что человек покупает сервер + какую-то сеть для парсинга, тратит на это скажем 500$ в месяц, при этом он пытается парсить один whois сервер и ессесно рано или поздно его забанят. Я скажу откровенно что никогда парсингом доменов не занимался в том масштабе о котором говорит ТС, т.е 80 миллоннов за сутки мне никогда не было надо, однако были случаи когда надо было обработать несколько тысяч доменов и запросить Whois по каждому... так вот даже на таких объемах я попадал под фильтры.... и это закономерно, по этому я лично не надеялся бы на то, что можно сделать > 1000 запросов к одному WHOIS серверу в сутки с одного ИП........

Исходя из этого, бюджет 500$ гораздо рациональнее потратить на покупку 500 хостингов в 1 доллару, повесить туда php скрипт и написать некий коммуникатор для работы с этими хостами, таким образом за тот же самый бюджет мы получим 500 * 1000 запросов в сутки, а это уже пол миллиона в день, при этом никаких фильтров и банов, ну и как следствие это около 15 миллионов адекватных ответов !!! в месяц... мне вот чисто интересно сколько вообще доменов то зарегистрировано или сколько надо спарсить ? неужели там триллионы какие-то ??? информация по ним меняется не так часто что бы парсить милларды каждый день.... да и это не реально в принципе.... по этому почему бы не работать с адекватными миллионами в месяц? этого мало для ваших целей? Тогда берите за 1000$ в месяц 1000 хостингов и получайте 30 миллионов в месяц ...

---------- Добавлено 19.03.2015 в 20:13 ----------

Digima:
Пытаются ускорить процесс внедрения, но даже халява в данном случае не дает желаемого эффекта к сожалению.

Да они выдают минимальными блоками адекватными :)))) Меньше выдавать нет смысла :)))

Полученный вами /64 в ipv6 , это много миллиардов адресов, которых хватит на все ваши девайсы которые у вас будут за период всей вашей жизни, а так же же жизни ваших родных и близких :)))

Посмотрите интереса ради общее количество Ipv6 адресов, я честно говоря не знаю как называются числа с таким кол-вом порядков :)

dlyanachalas:
У них софт из воздуха берется?
Конечно, они смогут его написать. Но ради вашей парсилки явно не станут заморачиваться.

Вы видимо не осознали мой сарказм, подобные алгоритмы для выявления парсилок >> УЖЕ ОЧЕНЬ ДАВНО << есть у каждого регистратора с публичным whois к которому идут массы обращений... Кстати особого софта то и не надо... ;)) масса штатных системных демонов делают это :)

🤪

Alех:
Увы, не довелось столкнуться с анонсированием таких данных, а так хочется всё это узнать.
Сегодня общался с представителем компании Verisign(реестр com и net, и т.д.), он сказал что это внутренняя информация и она не подлежит разглашению.
Безусловно, лимиты есть, но какие и где, ни на одном сайте об этом не написано.
И сколько я не общался с людьми занимающимися парсерами, ни один точных цифр назвать не может. ;)

Вы видимо не совсем понимаете принципы, whois сервер есть даже у нас, мы через него отдаем информацию об объектах которые принадлежат нам, при этом ARIN ссылается на наш whois сервер когда запросы относительно наших объектов попадают к ним, по этому лимиты моего whois сервера это моя личная информация и настройка, сколько хочу столько и ставлю, по этому конечно же никакой общей информации на эту тему быть не может, кто-то считает что 5 запросов в час с ИП это нормально, а кто-то считает что 1000 в день это хорошо, кому-то 10.000 в час не проблема.... Но надо четко понимать одну штуку, эти лимиты ЕСТЬ, ни о каких миллионах запросов в секунды никакой речи не будет никогда и я полагаю ни где, в лучшем случае вы моментально попадете в файрвол по кол-ву коннектов, тут до Whois ограничений может и не дойти даже :)

---------- Добавлено 19.03.2015 в 07:01 ----------

Alех:
Учитывая скорость распространения интернета, а также глубину его проникновения в повседневную жизнь(уже выпускают и холодильники с доступом в интернет от LG, на очереди стиралки и прочие) то на всех IPv4 не хватит.

Да что вы говорите :D Конечно же не хватит :)

---------- Добавлено 19.03.2015 в 07:03 ----------

dlyanachalas:
Непонятно, зачем их так разбазаривают. Хотят, видимо, чтобы и они рано или поздно стали заканчиваться.

Я думаю что даже если их будут раздавать такими темпами, мы с вами не застанем их окончание :)

dlyanachalas:
Это если у "них" будет соответствующий софт и понимание ситуации.

Ну да, у регистратора который обслуживает 1.000.000 доменов не будет софта который луснет парсер, насмешили :) 🍿

---------- Добавлено 19.03.2015 в 07:05 ----------

The WishMaster:
Это уже много лет говорят - но пока как-то хватает.

Не совсем так... точнее конечно же хватает, но countdown никто не отменял, пройдет еще годик, два, RIR вообще иссякнут и все.... я уже писал, что в ARIN уже реализован механизм посредством которого можно объявить нужду в IP адресах , а так же показать возможность дать эти самые адреса, т.е началась балалайка (при чем давненько) в которой я могу свои адреса дать кому-то поюзать .... если у меня они в избытке :) Появление таких механизмов мне лично прямо говорит о том, что ARIN старается как можно меньше выдавать IPv4 согласно штатного полиси. Например около года назад, я пытался получить под новую компанию блок размером /20, отказали, так как новые компании должны сперва получить от LIR адреса и грамотно их использовать длительное время.

Вообще, любой whois server тем более масштабный, который обслуживает много объектов в любом случае имеет лимит на количество запросов то ли в час то ли в сутки, это зависит от самого сервера, многие из них официально анонсируют эти данные на своих веб порталах, а некоторые whois сервера прямо отвечают о количестве оставшихся попыток вместе с ответом на запрос объекта. В любом случае ограничение будет, изначально оно будет трактовано самим whois сервером, а дальше может быть и усугублено в случае длительного монотонного потока запросов с одной подсети.

Romka_Kharkov:

Уважаемые читатели, освобождается несколько довольно больших блоков адресов, готовы обсуждать дальнейшее размещение.
Никаких блек листов и тому подобное, адекватные, чистые блоки!
Только под белые \ легальные цели , рассылки, сайты, сервисы.
Возможности blackhole через ТП, а так же самостоятельный доступ к PTR.
юни:
Ну да. Хотя с технологией не сильно знаком, конечно.

Особой разницы нет, важны цели.

Всего: 6838