смысл - не ехать лично в Минск
а если через реселлеров брать ?
например на speednames есть .by
это похоже на глюк гугла
глянь например http://www.google.ru/search?q=site%3Acom.de
да, словарь меньше 13Gb.
цифра 13Gb - это я поправил Kryukov, который оценивал размер словаря как раз по максимально возможной длине длине, а не по средней и получил 1Gb
максимальная - 128, средняя при текущем состоянии базы - 15
сейчас 15, может со временем расти, до 20-30
128 - это максимально возможная длина
Желательно - данные+индекс уложить в 2 размера данных в plain формате, можно превысить. Решения с 128*размер данных не проходят.
нет, я о том что обсуждали в этом топике до меня
ну скажем 20ms на Dual Opteron c 4Gb
если больше двух * - можно во время не вписываться.
да там чуть выше спецы такой алгоритм тривиальным обозвали :)
и уже реализованным во всех поисковиках
а как до дела дошло - ёк :)
для * даже grep не нужен - head достаточно
а grep - это и есть тривиальное решение за 3000 - выделенный сервер поставить :)
13Gb
а на шаблонах типа "*ll*wo*" для поиска "helloworld" какой тормоз будет ? :)
реально через suffix array решается, может что-то более эффективное есть, я не знаю.