Сколько стоит разработать и раскрутить поисковик?

I
На сайте с 26.05.2001
Offline
64
#21
CALM:
Уважаемые КАНДИДАТЫ НАУК, ну поконкретней если можно......

Если у Вас будет пара миллионов страниц, то ставьте Nutch или Dataparksearch. Для второго поставьте режим dbmode=cache. И будет все практически бесплатно. Так, например, на http://www.43n39e.ru/ проиндексировано 400 тысяч сайтов и миллион страниц. Возьмите сервер помощнее 2-4 процессора, быстрые SCSI диски запрягите в рейде и памяти гигабайт 6-8. И будет все очень быстро работать.

Приходите завтра, завтра будет! (http://itman666.livejournal.com)
CM
На сайте с 11.11.2006
Offline
0
#22

ITMAN, моя благодарность.

Если позволите, после ознакомления с означенными Вами движками, я задам еще несколько вопросов, если конечно возникнут.

Disell
На сайте с 05.06.2006
Offline
253
#23

itman, Чет битая ссылка какая то.

Лучшие вакансии ( http://hh.ru ) РУнета. Построй свою карьеру ( http://career.ru )
snoopckuu
На сайте с 26.02.2006
Offline
34
#24

Disell, отнюдь не битая, а рабочая.

itman, сразу бы хотелось добавить сколько я не крутил датапарк да и судя по отзывам никому кроме максима не удавалось проиндексировать такое кол-во документов :), там слишком много нюансов в настройке да и самая большая их беда кроме того что использует Mysql это то что новые билды бывают не поддерживают старую БД и с новым билдом поисковика надо делать ребилд всей базы :(.

CALM, Могу посоветовать поставить Nutch, и не только посоветовать но и поставить, вещь очень серьёзная из примеров на ней работает adre.ru. Есть так же свои модули и наработки. Русская морфология на уровне стэмминга, парсер иконок как на яндексе, определение гегорафическое принадлежности сайта к стране и многое другое. Если заинтересовались велком в личку.

Разработчик поисковых систем и алгоритмов. Я умнее яндекса. Мой синонимайзер. (http://se.o0o.ru)
CM
На сайте с 11.11.2006
Offline
0
#25

snoopckuu, я отправил в личку

Socionics
На сайте с 17.06.2006
Offline
209
#26
CALM:
Я, господа специалисты, если позволите несколько сужу вопрос под конкретную задачу

Есть необходимость организовать поиск по заранее заданной группе сайтов (500-1000)

Вопросы:

1. Какой движок необходим ?
2. Где добыть ?
3. Сколько должен стоить ?

Заранее благодарен за ответы

Поищите инфу про Alexa, они недавно решили давать возможность аренды своиъ ресурсов и даже собственного ранжирования сайтов по любой тематике.

А скоро и Google начнет.

M
На сайте с 29.03.2003
Offline
65
#27
snoopckuu:
Disell, отнюдь не битая, а рабочая.

Ночью электрики чинили подстанцию, вполне возможно, что смотрели сайт в это время...

snoopckuu:

itman, сразу бы хотелось добавить сколько я не крутил датапарк да и судя по отзывам никому кроме максима не удавалось проиндексировать такое кол-во документов :), там слишком много нюансов в настройке да и самая большая их беда кроме того что использует Mysql это то что новые билды бывают не поддерживают старую БД и с новым билдом поисковика надо делать ребилд всей базы :(.

Последнее изменение, требовавшее полной переиндексации было около двух лет назад, все остальные изменения касались добавления новых таблиц или столбцов в существующие таблицы, что вполне решается средствами SQL-сервера.

Все крупные успешные инсталяции используют PostgreSQL, а не MySQL. Наиболее крупная работающая инсталяция, извесная мне, насчитывает около 19 млн. страниц, правда всреднем примерно в 3 раза меньших по размеру среднестатистиченеской интернет-страницы.

Проверь свои запросы: Вершки Рунета (http://www.43n39e.ru/)
snoopckuu
На сайте с 26.02.2006
Offline
34
#28

Maxime, звучит убедительно, под рукой есть очень мощная машинка, опять проведу тесты только с PgSQL посмотрим что из этого получится. :)

[Удален]
#29

Кто может дать ссылки на отраслевые поисковики?

Самостоятельные, а не сделанные на базе Яндекс

VT
На сайте с 27.01.2001
Offline
130
#30
Уважаемые КАНДИДАТЫ НАУК, ну поконкретней если можно.....

Основная проблема здесь не столько в самом поисковике, а в его маркетинговой модели. Открыть новую поисковую систему не проблема - проблема ее раскрутить.

Здесь не поможет ни ноу-хау, ни хорошее качество поиска - сделать проект известным и восстребованным может только тематическая аудитория.

Смотрите, как поступает гугл, когда ему нужно вклиниться в новую нишу - он покупает социальные сети вместе со всеми их пользователями, увеличивая собственную аудиторию, которая этими сервисами пользуется, и не вкладывает ничего в раскрутку. Вот почему в большинстве случаев его проекты успешны.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий