Vetra, А когда нарожает корова телят - что с ними будешь делать? :(
Я вот тоже против убийств - чтоб вообще против фсяких. Недавно сестра купила шубу норковую... ох, я над ней и поиздевалась... аж вспомнить приятно :)
Ава, ну, ты мой любимый... друг :), ты давно знаешь :) Улыбка у тебя просто обворожительная :) Поэтому - с Днем Рождения!
Всегда Будь!
vedomir,
Оранжевую кепку... :D Без дураков :)
А может мне показалось... :)
konoplin,
Так им, курящим, и надо! Видите, какая я нацистка? :)
В Беларусь - ни ногой... там где я бывала, какая-то атмосфера нехорошая... у меня, наверное, на лбу написано было, что я неместная... уж не знаю, за кого принимали... :(
Ratwist, Я сторонница сей. PHP - сам по себе язык более высокого уровня, и, соответственно, юзает больше ресурсов.
Но - если вы, опять же, внимательно почитаете некоторые треды данного раздела, можно найти дискуссии, на чем вообще писать поисковики.
И, собственно, не чувствуйте ограничений - отдельные модули можно писать на разных языках. Почему бы и нет, если с++ имеет множество API Mysql, и вы собираетесь сливать все в блобы?
Если поиск локальный - пусть ваш индексатор будет на сях, а поиск - в виде php-скриптов.
Кроме того, окончательный алгоритм придумываете в конечном счете вы, и мы... хе-хе, "люди с опытом", в детали не посвящены, а телепаты - большая редкость.
Что такое у вас w1, w2....?
Ratwist,
Э-э... я смотрела невнимательно, и не вдумывалась, куда какие поля в индексе, то есть не разглядывала.
но, в общем, думаю, вы алгоритм будете еще усложнять.
1) Про хеширование слов - не боитесь, что при совпадении хэшей может возникнуть путаница? Как-то мы тут обсуждали хэши (не упомню, кажется, я же тему и начинала): совпадаемость довольно серьезная...
2) мое мнение - можно. пока не разглядишь...
3) если поиск локальный - все можно хранить в БД, как мне кажется. Не думаю, что вам не хватит размера блоба или произойдет перенагрузка БД (если у вас не супер-пупер мегапосещаемый портал с уймой аккаунтов на той же СУБД, которая просто уже трещит по швам).
Interitus,
Смайлик в конце поста...
И вообще, я больше в Англию хочу, а туда, блин, как раз никто не зовет. :)
Я в офисе сижу в углу - большое кресло не поместится.
Зато шеф не видит, чем я там в углу занимаюсь :)
4LF, Так ведь при ранжировании играет роль не только вес слова: словоформа, индекс цитируемости сайта, положение слова в документе (если пожелается), положение страницы на сайте (первая страница отличается от третьей степени вложенности)...
Кроме того, что будете делать при поиске словосочетаний?