TimeBomb

TimeBomb
Рейтинг
93
Регистрация
19.07.2005

начнем, пожалуй.

TimeBomb добавил 17.06.2009 в 02:39

я про все три за шесть если что =)

вижу, что прям СДЛ настоящий продаеццо, контент для рунета - УНИК! Читал его и так, и эдак, вот только никак в толк не возьму, про что там?😂

судя по картинке вот на этой страничке: http://web.archive.org/web/20071012004914/http://moukarich.com/

манимейкинг?

цену не дам. так что извините за оффтоп.🙅

intraweb, ну чтож, тогда как все 😂 Индекс не резиновый. Не все берут, гады 😂

intraweb, зафигачте ссылко с сайта правительтсва москвы на этот прожект - все будет. Против ТАКИХ аргументов Ян не попрет. Траст Вам в руки!😂

">HTML Почему в Opera не работает

Валидатор W3C ругается на этот атрибут если в Doctype стоит Strict

При Transitional - все ОК

bearman:
TimeBomb, а как быть с параметрами гет у ссылок?)) или так и создавать файлы в файл системе с гигансткими именами?

Вот тут товарищ так и сделал ;) http://www.phpclasses.org/browse/package/2682.html

Мне не очень понравилось... тут можно опять же имя файла хешем обзывать. Проблема останется только в сессионных переменных - гугль может поклеить их и назначить странице PR, а я пока не знаю как это приделать.

включить в Директе openstat

Слава Шевцов, да да да, вот именно об этом и думаю, только в два захода - сначала разделение на host и path, получение для host его id (он в базе должен будет быть к этому моменту), а хеш брать только от path

наличие первого прохода (операции над host) в данной задачке не критично, но фишка в том, что эти операции у меня в любом случае производятся (для других целей), так почему бы и нет? Меньше вероятность совпадений опять же 😂

TimeBomb добавил 27.05.2009 в 13:53

zzeus:
Деревья в БД - google://MPTT

Посмотрел. Классика в общем.

Однако мысль появилась такая: если взять вариант с файловой системой там есть один бонус - можно моментально получать (значение из файла)/(ошибку если файл не существует) если пользовать при обращении полный путь (вот та перевернутая конструкция из первого поста). логика будет элементарная - тупо на if exist

А вот с деревьями, боюсь, без лево-правых обходов или хранения списка родителей узла не обойдется.

bearman:
netwind, кстати да, можно хеш от хоста + хешь от всего урла, такое то врядли совпадет))
zzeus:
Для вас ИМХО - host + page и индекс по обеим полям решит проблему

На host + page разделить догадался, у меня этот разбор для других целей использовался, теперь и тут пригодится. У меня там еще и id-шки уникальные хостам в базе выданы - я прикидывал что страниц будет адски много, а вот хостов - все таки счетное количество.

TimeBomb добавил 27.05.2009 в 13:32

Кстати, а может быть кто-то видел в сети документ по устройству Google датацентров?

bearman, спасибо еще раз, становится все интереснее и интереснее....

bearman:
мемкеш не подойдет по простой причине которую не назвал слава - перезагрузка и пока всем вашим данным в нем. мемкеш - обычный хештейбл в ОПЕРАТИВНОЙ памяти сервера.

Слава не назвал эту причину, но я уже разобрался ;)

В любом случае, для моей задачи скорее всего потребуется "второй эшелон", для которого memcached будет как нельзя кстати.

bearman:
тебе надо использовать вложенность папок, дабы не создавать нагрузку на файлсистему, которая может в один прекрасный момент крашнуться и пока все данные.

Вариант описанный мной, (подредактировал первый пост - добавил урл для понимания его раскладки по файловой системе) вроде бы подразумевал вложенность папок... Или мы о разных вещах вещах говорим? Или я чего-то про файлы не знаю? Вы если что - про подводные камни не молчите. ;)

bearman:

бд. если расставить индексы в моем варианте правильно, то по 3-30 млн записей таблице у тебя
пр для любой ссылки будет искаться за абсолютный 0.

Вот не уверен что за абсолютный 0 все - таки... Может завтра с утра и поставлю пару экспериментов. Мне все-таки кажется (ой, что-то мне много всякого кажется😂) что можно для этой конкретной задачи придумать схему хранения с более быстрым откликом.

bearman:
еще как вариант можешь использовать sphinx. может приглянется правда он чуток для другого, но и для этой цели думаю может подойти. но с ним у тебя будут неокторые неудобства о окторых я промолчу(намек - ребилд базы надо делать чтобы поиск выдача менялась).

Про Sphinx посмотрю. Вещи касающиеся ребилдов базы меня не волнуют - хоть каждый день делай. Но пока ощущение что Sphinx - он и правда, немного для другого.

Всего: 523