Тематическая поисковая система (до 1000 сайтов) - как делать?

[Удален]
#31
vrom:
Ну насчет копеечности - покупать такие решения "под ключ" вполне могут за $2000-$4000 (сконфигурированный сервер с работающим сайтом и первоначальной настройкой)

Скорее 4000$, т.к. около 3000$ стоит скромный 1U сервер.

I
На сайте с 26.05.2001
Offline
64
#32

Чем же он не сравнимо? по-моему, единственная загвозка с многосёрчем на таких объемах - это обработка pdf, rtf, doc. За 21 тысячу долларов, которую гугл хочет за двухюнитную машинку на 0.5 миллиона доков, вполне можно

а) купить двух процессорную машинку с 8 или более гигами памяти. многосёрчу этого хватит чтобы не тормозить на 1.5 миллионах (2-3тысячи)

б) нанять человека за несколько тысяч, который прикрутит внешний парсер за 2-3 месяца.

в) выкинуть многосёрч и поставить аспсик, он индексирует и ищет побыстрее

и еще деньги останутся.

2-4 тысячи долларов за инсталляцию, это не много. Сколько, например, можно делать этих инсталляций в России? Думаю штук пять-десять в месяц при самом удачном раскладе. А на такие деньги "белая" фирма проживет с трудом, выгоднее чем-нибудь другим заняться. А еще всякие там конкуренты: Многосёрчи, Аспсики, которые в некотором роде бесплатны.

Приходите завтра, завтра будет! (http://itman666.livejournal.com)
I
На сайте с 26.05.2001
Offline
64
#33

Да, продолжая тему, на рынке можно что-либо получить, если только предложить какое-либо очень уникальное решение: быстрое, надежное, многоформатное, которое "держит", скажем, 10-20 миллионов документов при 10 запросах в секунду, имеет какой-нибудь простой язык для вкручивания разных там расширений типа SearchEngineScript :-) ну или прозрачный интерфейс для написания плагинов на джаве или плюсах,глубокую языковую поддержку всякую там синонимию, настраиваемость поиска, в частности хорошие возможности расширения запроса в случае, когда он мало результатов возвращает, а также хороший, самообучаемый спеллер.

Ну и многоплатформенность, ясен-пень, хотя бы на уровне разных *nixов.

Вот только тогда можно ломиться на рынок. Только посчитайте, сколько будет стоить такая разработка и насколько квалифицированные люди должны в ней участвовать. Их, прямо скажем, даже в одном месте собрать будет сложно.

vrom
На сайте с 15.12.2005
Offline
84
#34
Чем же он не сравнимо? по-моему, единственная загвозка с многосёрчем на таких объемах - это обработка pdf, rtf, doc.

Да не в этом загвоздка! Посмотрите на сайт mnogosearch: Вы видите "решение"? Я - нет. Вижу сайт сделанный программистами (маркетолога у них нет и менеджеров наверное тоже... иначе все было бы в разы лучше!).

Вижу GPL-софт, который может будет работать, а может нет... и придется его напильником и паяльником подгонять...

Это ни один корпоративный заказчик не купит... нет "товарного вида" ☝

2-4 тысячи долларов за инсталляцию, это не много. Сколько, например, можно делать этих инсталляций в России? Думаю штук пять-десять в месяц при самом удачном раскладе.

Мы по разному смотрим на этот рынок.

Для меня

2 инсталяции в месяц для такого продукта это ОЧЕНЬ ХОРОШО (в сравнени с обычной веб-разработкой)

А на такие деньги "белая" фирма проживет с трудом, выгоднее чем-нибудь другим заняться.

"Белый" ИП на упрощенке с налогом 6% и без офиса - легко проживет.

Разработка интернет-магазинов на CS-Cart (http://typo3lab.ru/cs-cart.html). Почему CS-Cart рулит? (http://typo3lab.ru/cs-cart.html#c967)
vrom
На сайте с 15.12.2005
Offline
84
#35
в) выкинуть многосёрч и поставить аспсик, он индексирует и ищет побыстрее

Вы советуете мне сразу многосерч выкинуть?

А в масштабе 2-3 лет это не будет ошибкой?

I
На сайте с 26.05.2001
Offline
64
#36

ну ок, давайте по-другому. просто описанный выше продукт, который реально продавать 5 копий в месяц, даже люди очень хорошо понимающие в разработке поисковых машин и программировании вообще меньше чем за 2-5 (а реально я думаю где-то 10 человеко лет) не напишут. итого нужно для начала инвестировать в проект 240 тысяч баксов минимум (в России). легко посчитать, что чтобы просто отбить эти деньги понадобиться не один год, не говоря уже про такую маленькую проблемку, как начальные вложения. и это все при том раскладе, что замечательных программистов, которых Вы пригласите будут работать с большим энтузиазмом (понимая при этом, чтоб работа, собственно только на год) и их никто в это время не переманит. А если вы всех программистов решите оставить после запуска продаж, то это дополнительные большие расходы.

А потом продукт нужно постоянно обновлять фиксить, итд. за это время могут придти другие игроки и предложить продукт лучше (например потому что у них инвестиций больше). А вероятность этого очень велика, ведь посмотрите сколько разных поисковок уже наваяли. Короче, чтобы не тратить больше время: это очень и очень затратный, трудоемкий и рискованный бизнес. и в случае успеха бенефиты довольно скромные. Другое дело, если закрепиться на рекламном рынке. Он постоянно растет, там есть смежные проекты, можно делать портал итд итп. И свой продукт в результате можно не делать каким-то исключительным. Ведь при больших годовых оборотах это не очень важно сколько используется машин 100 или 1000. И не обязательно делать продукт идеального качества, потому как часть пользователей можно привлечь портальными сервисами.

vrom:
Мы по разному смотрим на этот рынок.
Для меня
2 инсталяции в месяц для такого продукта это ОЧЕНЬ ХОРОШО (в сравнени с обычной веб-разработкой)
"Белый" ИП на упрощенке с налогом 6% и без офиса - легко проживет.
I
На сайте с 26.05.2001
Offline
64
#37

я не советую, потому что не знаю объем легаси и Ваших возможностей копаться в коде аспсик. но мне аспсик показался более современным с точки зрения индекса. но есть большое НО, он давно не развивается. часть его создателей в яндексе, часть еще фиг знает где :-) может когда mnogosearch его и догонит когда, если откажется от идеи раскладывать индекс по реляционным табличкам.

vrom:
Вы советуете мне сразу многосерч выкинуть?
А в масштабе 2-3 лет это не будет ошибкой?
vrom
На сайте с 15.12.2005
Offline
84
#38
даже люди очень хорошо понимающие в разработке поисковых машин и программировании вообще меньше чем за 2-5 (а реально я думаю где-то 10 человеко лет) не напишут. итого нужно для начала инвестировать в проект 240 тысяч баксов минимум (в России).

Сорри, я не четко выразился.

Я не планирую ничего разрабатывать.

Я планирую просто продавать СЕРВИС на основе замечательного GPL-продукта mnogosearch (или какого-то другого).

Этот сервис включает в себя законченное решение

- сайт на TYPO3 (www.typo3.org) - тоже кстати GPL

с каталогом сайтов

- mnogoseach установленный и настроенный и прикрученный к этому каталогу

- установку этого всего на сервере и полный комплекс пусконаладочных работ

- дизайн если требуется...

- ... прочее

GPL это не противоречит... более того - именно так развивается TYPO3.. за счет таких сервисов.

Z
На сайте с 03.01.2004
Offline
32
#39
itman:
может когда mnogosearch его и догонит когда, если откажется от идеи раскладывать индекс по реляционным табличкам.

См. dataparksearch, это клон mnogosearch, работает пошустрее, если использовать cache mode, от которого отказались в mnogosearch, и развивается. Есть FreeBSD порт, www/dpsearch

VT
На сайте с 27.01.2001
Offline
130
#40
См. dataparksearch, это клон mnogosearch, работает пошустрее, если использовать cache mode, от которого отказались в mnogosearch, и развивается. Есть FreeBSD порт, www/dpsearch

Zute, судя по всем вашим сообщениям в этом форуме, вы и есть разработчик dpsearch?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий