Нужен совет от опытных проектировщиков БД и программистов

1 2345 6
[Удален]
#21
Thats right:
comment_id | topic_id | comment_pid | comment_text

Выбираем данные по topic_id, причем списком. Подряд. Сортируем на клиенте яваскриптом. Минус - может тормозить клиент. )))

на клиенте - пипец сео)

чем nested sets не устроили?

Thats right
На сайте с 29.08.2005
Offline
84
#22
bearman:
на клиенте - пипец сео)

А задачи не стояло - это раз. А почему пипец? - это два. Если бы яндекс отрабатывал js, то пипец яндексу :))) А так - сойдет :) Тем более можно всё пихать в таблицы типа <table id="cmID" class="cmPID">. bearman, честно говоря, эта идея давно пришла, хочу чтобы народ потестировал, у меня просто времени нет, ща как раз вожусь с гигабайтами в БД:)))). Идея то в принципе интересная на мой взгляд. По поводу нестед... Я когда-то скидывал на форуме ссылку на интересные тесты по сравнению технологий хранения данных в бд. Если найдут, то думаю им будет интересно узнать скорости :)

Магазин керамической плитки и керамогранита (http://www.sbsshop.ru)
[Удален]
#23
Thats right:
Если найдут, то думаю им будет интересно узнать скорости

material paths

nested sets

chained lists(parents)

это вроде все из самого юзабельного)

мне ближе к серду лежит nested sets

про таблицы в хтмле, да, можно конечно. только я бы все таки материальные пути выбрал наверное, их рекурсией не надо строить ;)

DD
На сайте с 03.05.2009
Offline
44
#24
Thats right:

На очень крупных порталах софт для баз данных - платный.

Давайте определимся а что такое большой сайт, или портал? Вот для Вас именно что действительно большой портал (кроме вконтакте и однокласники:o)

[Удален]
#25
dar darbl4:
(кроме вконтакте и однокласники)

"школьный портал" на DLE :D

Thats right
На сайте с 29.08.2005
Offline
84
#26
bearman:
только я бы все таки материальные пути выбрал наверное, их рекурсией не надо строить

Согласен. В тестах показывает неплохой результат. Вообще, на мой взгляд - материала в сети вагон. Нужно только гуглом уметь пользоваться. А вопрос выбора - берем железку. загоняем на неё БД и гоняем тесты. Много тестов. Много данных. Кроме этого, вот как всегда ТС не обозначил нормальных входных данных. Чего, сколько и так далее. Кроме этого не сказано, на что он готов, а именно - использовать опенсоурс или коммерческие продукты. Задача должна быть приблизительно так поставлена:

общее число комментариев - 300000

кол-во топиков - 10000

максимальное кол-во комментов на топик - 1000

Железо такое то.

Вывод комментариев - дерево/список

Частота добавления комментов - 10 в минуту.

ну и так далее. Вот это уже постановка задачи. А не просто вопрос ни о чем.

Thats right добавил 06.02.2010 в 18:30

dar darbl4:
кроме вконтакте и однокласники

Я промолчу :)

seosniks
На сайте с 13.08.2007
Offline
389
#27
bearman:
поржал)

миллион = 1000 000 + о-малое

30 метров = 30 000 000

то есть 30 байт на строку, вы видимо часто пишете каменты вида "+1!!!11адынадын!! анатоле!" =)))

реально под гигабайт-5 будет на миллион каментов, но когда миллион - тогда и разговор уже не вв пустых словах :)

Коменты слово растяжимое. ;)

Если коменты будут по 1 - 10 к знаков то конечно и 5 гигов не хватит. :D

А так миллион коментов по 40 знаков будет метров 50 -70 от силы

Thats right
На сайте с 29.08.2005
Offline
84
#28
seosniks:
Если коменты будут по 1 - 10 к знаков то конечно и 5 гигов не хватит.
А так миллион коментов по 40 знаков будет метров 50 -70 от силы

Да хоть терабайтов, важно - количество записей в таблицах.

Hi!
На сайте с 15.12.2006
Offline
103
Hi!
#29

можно, конечно, изобретать колесо.

А можно посмотреть в код, структуру таблиц и подход многих известных opensource движков - как блогов, так и форумов. Многие из них прекрасно справляются с сотнями тысячами записей в форуме/блогах. И при этом, я бы не сказал, что вордпресс или vbulletin используют какие-то сверх изощренные схемы хранения данных.

[Удален]
#30
Hi!:
Многие из них прекрасно справляются с сотнями тысячами записей в форуме/блогах.

это мало, хочется больше рассчитать

bearman добавил 06.02.2010 в 18:40

Thats right:
Да хоть терабайтов, важно - количество записей в таблицах.

важна расстановка ключей и индексов ... остальное - мелочи.

1 2345 6

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий