Поисковик

123
8
На сайте с 28.07.2008
Offline
3
#11

ха-ха)) система ранжирования пока не разработана)))) php+мускуль - тоже жжёшь))

Мой вам совет - бросайте это дело и как можно быстрее. Не тратьте своё время на работу, которая заведомо не будет выполнена хорошо.

Если проиндексировать web, условно, "каждый дурак" может, это задача разрешимая, то релевантно расположить результаты - задача в разы сложнее, это и есть основной критерий качества поисковика.

Ну а уж про бизнесс-модель и нечего говорить. Почитайте побольше, начните с roem.ru, может дальше уже читать расхочется))

[Удален]
#12

я же не говорю и не обещаю что это поисковая система побьет Yandex Google (она рассчитана на малый объем)

NN
На сайте с 02.10.2008
Offline
8
#13
Cr1t:
VDS брал у Фирста (настоящий тормоз)
Думаю арендовать сервер, но не могу найти нормальный и не дорогой (для начала думаю VDS подойдет)

Бери любой немецки! По деньгам на много выгодней!

Cr1t:
гугла и яшу равать точно не буду и тем более не смогу :)
Для теста хочу сделать поиск по определенному региону (примерно прау миллионов страниц, а то и больше) думаю VDS выдержит) нагрузку индексации сайтов

Пару миллионов страниц с простой системой ранжирования)) тут одним серваком не обойтись! )) Тут мини кластер нужен...

Cr1t:
нет не секрет..
Работает на php и mysql
Индексирует только сайты которые находятся в базе..
Системы ранжирования пока нет...

Извени! но не будет у тебя работать пара миллионов страниц на мускуле) узнай по подробнее про ранжирование, возьми калькулятор, посмотри что нужно и что даёт мускул)) возможно перейдёшь на постгрис

raz:
Ждем.. посмотрим что за оно))

главное в этой фразе "))"

Cr1t:
я же не говорю и не обещаю что это поисковая система побьет Yandex Google (она рассчитана на малый объем)

На этом форуме люди опытные и так понимают что об этом речи не идёт. Тем более если у тебя нет системы ранжирования и в добавок возможно юзаешь LIKE "слово%")))

Почитай по больше в википедии... о поисковиках...

Удачм!

gtauter
На сайте с 08.06.2008
Offline
131
#14

Сорри за оффтоп ТС, но желаю Вам удачи. Искренне.

А поиск для начала лучше сделать региональным/узкотематическим.

Еще можно сделать аддурилку и спалить урл на серче - отбоя от новых заявок на индексацию не будет ;)

С уважением, Евгений. Моя визитка (gtauter.ru). Привет из "Теслы" :)
[Удален]
#15
gtauter:
Сорри за оффтоп ТС, но желаю Вам удачи. Искренне.
А поиск для начала лучше сделать региональным/узкотематическим.
Еще можно сделать аддурилку и спалить урл на серче - отбоя от новых заявок на индексацию не будет ;)

Спасибо большое...

Cr1t добавил 16.11.2008 в 21:01

8Racer:
ха-ха)) система ранжирования пока не разработана)))) php+мускуль - тоже жжёшь))

Мой вам совет - бросайте это дело и как можно быстрее. Не тратьте своё время на работу, которая заведомо не будет выполнена хорошо.

Если проиндексировать web, условно, "каждый дурак" может, это задача разрешимая, то релевантно расположить результаты - задача в разы сложнее, это и есть основной критерий качества поисковика.

Ну а уж про бизнесс-модель и нечего говорить. Почитайте побольше, начните с roem.ru, может дальше уже читать расхочется))

Спасибо учту...

NN
На сайте с 02.10.2008
Offline
8
#16
VipRaskrutka:
http://www.sphider.eu/ уже готорый поисковик на php с mysql , активно потестил - php и mysql - это не для поисковика, более менее серьезного....

протестил двиг)) дааа... чег-то на 25 миллионах страниц стал не работоспособным)))

[Удален]
#17
NeoNiks:
протестил двиг)) дааа... чег-то на 25 миллионах страниц стал не работоспособным)))

Тоже надо попробовать :)

L
На сайте с 03.05.2006
Offline
171
#18

А что, дело благородное. Тематический поиск нужон. Только краулерами своими сайты не кладите.

А теперь про техническую реализацию проекта.

Надо взять много маленьких VPS (как вариант боьшой сервер и порезать его на кусочки, но лучше поначалу много маленьких ВПС) и размазать по ним проект. при этом добиться того что случайное убивание несколькоких из них не приводило к падению всей системы.

Также надо добиться того чтобы добавление еще одной ВПСки в систему приводило к уменьшению нагрузки на все остальные системы.

Так вы построите масштабируемую систему. Это нужно для большого количества запросов.

Мускл + ПХП хорошо, но медленнее чем могло бы быть на других системах. Это некритично поначалу, т.к. систему нужно строить очень распределенную. Например запрос обрабатывается и отсылается на десятки/сотни копьютеров (маленькие ВПСки в вашем случае), они обрабатывают результат и возвращают его в агрегатор, который уже компанует конечный ответ сервера.

При этом разумно поделить запросы на высоко частотные и низкочастотные и сделать для них быструю (маленькую) и медленную (большую) базу данных, или проще говоря некий аналог кеша.

Дальше будет видно кто тормозит и оптимизить эти куски, вплоть до переписывания их на С - оно не очень трудно, т.к. из всего функционала мускла вы будете использовать около 1%. Пеед тем как переписать - почитайте кнутта - много чего умного писал!

Вот както так я бы двигатсья начал.

LiteCat
На сайте с 03.05.2007
Offline
240
#19

Пусть человек развивается:) может разберётся в поисковых технологиях через 5-10 неудачных экспериментов

[Удален]
#20

Полностью с вами согласен..

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий