Когда дело заходит за разгребание проблем, то программисты на вилы и мега быстрым способом расставляются подпорки и костыли - Администрирование серверов

Как построить правильный маштабируемый кластер.

SantaClaus · 2007-06-28T11:02:12.0000000Z

Есть ресурсоемкий сайт, на хорошем сервере (PHP+MySQL, 2 dualXeon/4гб/2*120Гб, mysql вынесен на отдельном харде) держал пиковую посещаемость более 25К посетителей (120К страниц по 100 кб каждая), добавили памяти еще плюс 2Гб, настроили кеширование, но что-то случилось и теперь не может выдержать даже 15К (наверное больше, но учитываются только те, кому удается достучатся до сайта), вылетает с криками "too many connection". Может кто встречался с пожожей проблемой. Но главный вопрос таков: "Как построить правильный маштабируемый кластер." Пришли к идее решать проблему апаратным маштабированием. То есть, увеличением количества серверов. Поскольку все равно, рано или позно придется это делать. Бюджет на оборудование в принцыпе не ограничен, но ориентируюсь на этом этапе вложится в 3-5К уе. на закупку нового оборудования. Сколько серверов надо, с какой конфигурацией каждый и под какую задачу каждый? Интересно услышать идеи, на чем должен жить проект, чтоб плавно маштабироватся до 50К-100К-200К и т.д. То есть, маштабирование методом: выросла посещаемость - докупил еще серверов.

[Удален]

29 июня 2007, 17:39

#11

barty:

Кластер построить не сложно и в ваш бюджет все укладывается, разве что в сторону mcluster не стоит смотреть.

А что такое "mcluster"?

152

OZE

29 июня 2007, 17:45

#12

SantaClaus:
А что такое "mcluster"?

что такое mcluster

K

223

kostich

29 июня 2007, 19:02

#13

MIRhosting.com:
обычно кеширование в памяти и акселерация делается одним модулем. скажем, xcache (выглядит очень интересно), apc (бывают странные глюки). ну и классика - eaccelerator, эффекта меньше, но все же лучше чем без него. Это все касательно php.

обычно - уместно только в теории. когда дело заходит за разгребание проблем реально запущенного проекта, то программистов на вилы и мега быстрым способом расставляются подпорки и костыли.

проверенная ддос защита (http://ddos-protection.ru) -> http://ddos-protection.ru (http://ddos-protection.ru), бесплатный тест, цена от размера атаки не зависит.

203

MIRhosting.com

29 июня 2007, 21:22

#14

kostich:
обычно - уместно только в теории. когда дело заходит за разгребание проблем реально запущенного проекта, то программистов на вилы и мега быстрым способом расставляются подпорки и костыли.

Ну то что я пишу основано на практике. И написанное касается именно работы сис.а админа касательно кеширования и оптимизации на этом уровне.

Программисты - это безусловно важно, и пожалуй прежде всего надо пинать программистов. Ну а вместе с тем и оптимизация сервера(ов) согласно задачи и ее узким местам.

К тому же тут вроде не шла речь про мега быстрые способы разгребания ;)

Андрей Нестеренко, MIRhosting Облачная платформа для DevOps (https://mirhosting.com/paas)

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

K

223

kostich

30 июня 2007, 07:43

#15

MIRhosting.com:
Ну то что я пишу основано на практике. И написанное касается именно работы сис.а админа касательно кеширования и оптимизации на этом уровне.

Ну практика у всех разная, вот в этой схеме вижу большое количество минусов. Способ совершенно не универсальный и массштабировать с помощью него бесконечно нельзя. Прилепленная ферма из memcached утилизирует ресурсы более эффективно. Если нужно еще и выходные запросы кэшировать, то лучше поставить еще и ферму из squid + wccp v2 настроить на маршрутизаторе.

MIRhosting.com:

Программисты - это безусловно важно, и пожалуй прежде всего надо пинать программистов. Ну а вместе с тем и оптимизация сервера(ов) согласно задачи и ее узким местам.
К тому же тут вроде не шла речь про мега быстрые способы разгребания ;)

Тут речь шла о массштабируемости, точнее о правильной массштабируемости. Массштабировать тем, что даёт увеличение производительности только в рамках одного элемента ессественно не правильно.

Исходя из этого вот собственно и использую memcached для эффективного кэширования между всеми элементами кластера. Следовательно SQUID использую на фронте, возможно перейду на nginx, когда он научится кэшировать. Каждый фронт на сквиде имеет доступ к кэшам соседей, что сами понимаете даёт хороший эффект, вот в случаях с дорогим запросом на задник это реально спасает. В случаях с WCCP v2 массштабировать можно фактически бесконечно... групками по 32 элемента. Но поверьте мне, что 5 хороших серверов держали на фронте до 45тыс активных коннектов... а еще сколько неактивных там было, можно даже не считать. Само собой это всё под фряшкой, с патчами на тему accf_http и т.д.

Чем массштабировать mysql? да ничем его не массштабируешь... его можно массштабировать только репликацией master-slave, что при грамотном подходе и специфике конкретного приложения может дать очень большой эффект. Почему я когда-то остановился на memcached? всё очень просто - его сейчас лепят к чему только можно. Имея на руках кластер из memcached можно задействовать его и под mysql... еще правда не смотрел на тему доделали они или нет, но вот вот доделают.

Если база постоянно дергается на запись, то нужно перерабатывать большую кучу алгоритмов. Самый простой пример это счетчики для статистики или билинги реального времени, которые изначально были сделаны под ограниченную производительность. Причина в атомарных операциях, т.е. по сути в блокировках. Следовательно что бы приложение было массштабируемым надо применять соответствующие алгоритмы, которые как раз не вызывают блокировок.

Основная иллюзия - переедем на оракл и всё будет ок, там есть оракл рак, грид и всё такое - фигня всё это. Если целостность, ограничения, исключения и прочие вещи требующие уникальности дергаются постоянно, то мы рано или поздно опять упремся в этот атомарный потолок.

Вернусь к счетчикам и биллингам. Обычно программисты делают каунтеры и в реальном времени их увеличивают. Данный метод работает до определенного уровня одновременных конектов. Опять же, важно знать не столько конектов одновременно, а их динамику во времени. Если у нас 100 конектов в секунду такой алгоритм отрабатывает, то при увеличении их количества, механизм, проверяющий целостность, внесет задержку. Если задержка эта будет существенной, то какая-то часть запросов не сможет отработать за эту секунду, а следовательно при такой интенсивности это все через какой-то момент навернется, т.к. запросы будут скапливаться.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

K

223

kostich

30 июня 2007, 07:48

#16

Что такое массштабируемый счетчик. Нужно отказаться от учета в реальном времени в тот момент когда оно не надо. Ну зачем нам знать, сколько в той или иной позиции там хитов или уников. Статистика должна сливаться в приемники, который это сливают в базу неблокируемым INSERT-ом. Т.к. цена вопроса при сбое у нас копеечная, то мы отказываемся от каких либо ключей и база может быть не только массштабируемая, а еще и распределенная.

Вот я на реальном примере описываю, как делать правильно.

INSERT на самом деле не принципиален, т.к. есть еще работа с таблицами на очень низком уровне. Конечно это в этот момент с ними ничего делать нельзя, но тем не менее это в разы быстрее даже при отключенных индексах. Если мы хотим реальное время, то должны от этого отказаться. Вот тут самое интересное, т.к. видеть статистику в реальном времени нужно только человеку, фактически по запросу. В момент происхождения запроса select-ом собираются необходимые записи во временную таблицу или еще куда-то, а там уже делаются все необходимые count. Простой INSERT и простой SELECT массштабируются до бесконечности. Ну само собой если в таблице никаких проверок нет, типа ключей уникальных или еще чего. И если кто не знает, то напомню - COUNT тоже блокировку возникает, но главное что бы она была в тот момент когда в базу записи не сыпятся... если мы про myisam и т.д.

Исходя из этого можно массштабировать простые задачи без всяких ораклов и прочего, только на одном mysql. Дешево и до бесконечности.

ps. а вообще всё упирается в ДНК архитектора системы и в ДНК программистов.

pps. если кому чего мега веселое надо, то могу построить... есть опыт массштабирования проекта до пары стоек. многие хотели второй спайлог, но не у всех получилось это дешево и красиво... если кто хочет всё и сразу, то в личку.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

K

223

kostich

30 июня 2007, 08:09

#17

Эффективное кэширование.

Кстати, скоро NetVillage.ru уже заработает и там всё можно будет почитать. Пока сумбурно сюда что-то закину. Тем про кластеры очень близкая и с ней уже связан много лет. Многие админы полагают, что решение проблемы сводится к установке акселератора и кэширующего механизма на фронте. Я не зря упомянул про мемкашэд, т.к. в большинстве случаев он эффективен. Поясняю - особенность HTTP протокола в данном случае заключается в том, что если в запросе будет кука, то кэширование возможно в рамках конкретного клиента. Следовательно кэширующий HTTP прокси не будет давать должного эффекта, если только на нем не настроено срезание кук. Кэш кэш кэш - кричат многие начинающие админы. Фигня всё это. Если взять в руки калькулятор, а еще лучше живые тесты, то распределенное кэширование даст более больший эффект на низком уровне, чем если мы будем кэшировать итоговый результат - факт.

При наличии хорошей и массштабируемой раздавалки типа nginx статику вообще кэшировать не надо. С другой стороны, за неимением общего дискового пространства ИЛИ реплицируемого дискового пространства мы не можем пренебрегать массштабируемым элементов на фронте. Если нужно быстро и дешево решить задачу по массштабированию раздачи статики до 100-200k активных сессий, то без акселераторов мы быстро это не сделаем. Если акселераторы будут иметь распределенный сторадж на своем уровне, то это будет работать в разы эффективнее.

Ну само собой надо релоады резать и всё сопутствующее, т.к. в момент атак каких-то, в запрос добавляют всё то, что приведет к пробою запроса на задник. Если 100k пролетит до задника, то всё умрет.

Если рассматривать аспекты надежности, то такая система менее стабильна, нежели чем система с распределенным хранением статики на раздачу. Почему? При подыхании задника дохнет вся система. Если нам нужно увеличить надежность, то на фронте должна быть высокопроизводительная массштабируемая балансировка по куче задников, на которых стоят хорошие раздавалки, ну и хранение распределенное.

Если мы хотим 100k активных сессий раскидывать одним фронтом, к примеру по имени директории в URL, то нам надо забыть про сокеты вообще. Делаться все должно на уровне ядра, возможно в user space, возможно какими-то патчами на файрвол, что бы по первой строчке в пакете наш syn proxy делал NAT на нужный задник и/или группу задников.

ps. удачи и до встречи в моем блоге на NetVillage.ru

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

152

OZE

30 июня 2007, 14:15

#18

kostich, спасибо, многа букаф:)

Где взять доки по построению масштабируемых решений?

А то в ваших сообщениях я встретил кучу незнакомых терминов и вообще ничего не понял😕

_

299

_Ad

30 июня 2007, 15:22

#19

SantaClaus:
это говорит Mysql ,
увеличение max_connection не дает никакого результата ..
пробовалось разные sort_buffer_size (до 64М ), read_buffer_size, key_buffer_size (512М)
также не помогает .... разве что вылетает з нехваткой памяти Out of memory (Needed 20965728 bytes) ...
все конекты в статусе "Sorting" или "Copying to tmp table" ....

в чем проблема :
в памяти ??? свап не используется даже когда сервере уже не отвечает ...
в CPU ??? idle даже может быть до 30%, но не всегда
gstat - не показывает сильной нагрузки на какой либо хард, только иногда ...

PS
как узнать что не было ddos атак?

Автору совет пока не заморачиваться с масштабируемостью, а просто вынести все базы на отдельный сервер. Это гораздо проще (а главное, дешевле), чем полноценный кластер ставить...

База и скрипты с файликами на разных серверах - это самое часто встречающееся решение проблемы с большой нагрузкой.

Стоит ли пользоваться авторегистрациями Как реализовать единую систему Как поисковики отнесутся к

[Удален]

30 июня 2007, 18:18

#20

С проблемой разобрались - некая форма DDoS-атаки

О моем сервере.

Я признал, что он мне сильно нравится. Мощи немеряно, запас по производительности - еще раз так 5. После героических оптимизаций скриптов и всего что только можно, уже почти обрабатываем через себя все запросы DDoS-щиков. :-)

А сам сайт, если кому интерестно, вот он: www.AUCTION.ua

Сороковый по посещаемости в Украине. Если б раньше вычилили проблему с DDoS, возможно был бы уже в трицатке. :-)

Вопрос свелся к следующему.

Как вычислить исполнителей и заказчиков DDoS?

Готовы хорошо заплатить.

Но это наверное в другой ветке.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

Маркетинг для шоколадной фабрики. На 34% выше средний чек

Яндекс Вебмастер вынес товарные фиды в отдельный раздел

Как построить правильный маштабируемый кластер.