начнем, пожалуй.
TimeBomb добавил 17.06.2009 в 02:39
я про все три за шесть если что =)
вижу, что прям СДЛ настоящий продаеццо, контент для рунета - УНИК! Читал его и так, и эдак, вот только никак в толк не возьму, про что там?😂
судя по картинке вот на этой страничке: http://web.archive.org/web/20071012004914/http://moukarich.com/
манимейкинг?
цену не дам. так что извините за оффтоп.🙅
intraweb, ну чтож, тогда как все 😂 Индекс не резиновый. Не все берут, гады 😂
intraweb, зафигачте ссылко с сайта правительтсва москвы на этот прожект - все будет. Против ТАКИХ аргументов Ян не попрет. Траст Вам в руки!😂
Валидатор W3C ругается на этот атрибут если в Doctype стоит Strict
При Transitional - все ОК
Вот тут товарищ так и сделал ;) http://www.phpclasses.org/browse/package/2682.html
Мне не очень понравилось... тут можно опять же имя файла хешем обзывать. Проблема останется только в сессионных переменных - гугль может поклеить их и назначить странице PR, а я пока не знаю как это приделать.
включить в Директе openstat
Слава Шевцов, да да да, вот именно об этом и думаю, только в два захода - сначала разделение на host и path, получение для host его id (он в базе должен будет быть к этому моменту), а хеш брать только от path
наличие первого прохода (операции над host) в данной задачке не критично, но фишка в том, что эти операции у меня в любом случае производятся (для других целей), так почему бы и нет? Меньше вероятность совпадений опять же 😂
TimeBomb добавил 27.05.2009 в 13:53
Посмотрел. Классика в общем.
Однако мысль появилась такая: если взять вариант с файловой системой там есть один бонус - можно моментально получать (значение из файла)/(ошибку если файл не существует) если пользовать при обращении полный путь (вот та перевернутая конструкция из первого поста). логика будет элементарная - тупо на if exist
А вот с деревьями, боюсь, без лево-правых обходов или хранения списка родителей узла не обойдется.
На host + page разделить догадался, у меня этот разбор для других целей использовался, теперь и тут пригодится. У меня там еще и id-шки уникальные хостам в базе выданы - я прикидывал что страниц будет адски много, а вот хостов - все таки счетное количество.
TimeBomb добавил 27.05.2009 в 13:32
Кстати, а может быть кто-то видел в сети документ по устройству Google датацентров?
bearman, спасибо еще раз, становится все интереснее и интереснее....
Слава не назвал эту причину, но я уже разобрался ;)
В любом случае, для моей задачи скорее всего потребуется "второй эшелон", для которого memcached будет как нельзя кстати.
Вариант описанный мной, (подредактировал первый пост - добавил урл для понимания его раскладки по файловой системе) вроде бы подразумевал вложенность папок... Или мы о разных вещах вещах говорим? Или я чего-то про файлы не знаю? Вы если что - про подводные камни не молчите. ;)
Вот не уверен что за абсолютный 0 все - таки... Может завтра с утра и поставлю пару экспериментов. Мне все-таки кажется (ой, что-то мне много всякого кажется😂) что можно для этой конкретной задачи придумать схему хранения с более быстрым откликом.
Про Sphinx посмотрю. Вещи касающиеся ребилдов базы меня не волнуют - хоть каждый день делай. Но пока ощущение что Sphinx - он и правда, немного для другого.