Я чего-то не понимаю: чтобы зарабатывать на этом деле деньги нужно отбирать аудиторию. Тепмами, превышающими рост интернет-аудитории. То бишь отвлекая пользователей от других поисковиков. Это в моем понимании бодаться. А если не бодаться, то сервис закроется за недостатком финансирования.
Ну, ок, надеемся тогда, что в форуме появится тема: открыт новый украинский поисковик. И, вообще, удачи, она вам очень понадобится. Потому что это нешуточное занятие - бодаться с такими титанами как Гугль и Яндекс.
Ну понятно, что это решение для 2-3 запросов в минуту.
Чтобы отвечать на несколько запросов в секунду придется поставить примерно 30 гигов ОЗУ :-)
Мета, на первый взгляд, в несколько раз меньше Яндекса.
Число сайтов не является показательным. С точки зрения yandex.ua в УАнете примерно 40-50 млнов страниц. Запихнуть на один сервер в принципе можно, но будет тормозить, особенно если индексация тоже на том же сервере вертится :-)
Ну как можно скрестить крокодила с бегемотом, у них же совершенно разные способы хранения индекса??? Поясните, плз, почему нужно обязательно индексировать многосёрчем?
это в SQL-моде. инвертированный индекс разложен в таблицу с полями url_id, word_id или с полями url_id, word в новых версиях. разумеется неоптимально и подходит только для маленьких баз. Об этом и весь разговор. А в datapark и aspseek список вхождений каждого слова хранится как блоб или занимает последовательный кусок файла.
сорри, но это я не смотрел. в Яндекс.сервер, уверен, алгоритм сделан хорошо :)
Просто надо сказать большое спасибо разработчикам gcc 2.95, собственно из-за которых код и стал настолько стандартным. А также разработчикам GNU в целом за нетредсейфную реализацию строк. Тут все дело в том, что к моменту появления более свежих версии gcc проект "разбежался"
А насчет постановки Яндекс.сервера. Не пробовал, но слышал отзывы, точнее стоны.
не уверен опять-таки, что за 500 баксов - это будет поисковка под солярку. под солярку вроде как все достаточно дорого, хотя быть может я и ошибаюсь.
А какие проблемы с 10-ой соляркой? она, вроде как достаточно стандартная и всякие там новомодные функции вроде snprintf и прочая там есть. основные проблемы там должны быть с версией компилятора и mysql api. если честно, то я думаю, что это возможно, но бесплатно я бы заниматься этим не стал.
спорим на 500 баксов, что я его соберу под 5пятый mysql и он даже заработает? 😎