Maxime

Рейтинг
65
Регистрация
29.03.2003
Слава Шевцов:
Интересно, а раззиповка индексных файлов из памяти работает быстрее, чем чтение с диска?

Да, и требует больше памяти.

glazov:

Оригинальный дизайн такой, мне например нравится зеленый цвет

Тогда вам сюда: http://www.43n39e.ru/ :)

http://gogo.ru/ - вот и он, поиск от Mail.ru, внизу серпа указывается копирайт.

Ну и используйте длиные 16-ричные числа, например, CEFACDEE78FE, нормальные люди такими словами не разговаривают, а поисковики индексить будут.

Только проспамят эти слова легко, как только узнают для чего они :)

Leom:
А вот строить тематический поисковик на базе нашего SearchInform Internet Server-a очень даже имеет, потому что поиск по тематическому поисковику всегда по определения будет лучше чем по общему хотя бы из за того что никто тематический поисковик спамить не будет.

Брехня, таки спамят. Если не спамят, то поисковик настолько убог, что даже спамерам не интересен :)

Leom:

А вот тут то уже и критично число серверов и т.д. которые очень даже стоят деньги. А наш основной конек это производительность, которая позволит имет намного меньше железа, чем если например использовать nutch lucene и т.д......... И в конечном итоге на больших объемах получается что дешевле заплатить пару сотен килобаксов за платное решение но сильно сэкономить на железе и в итоге стоимость железа + софта у нашего очень даже платного решения получится дешевле.

Вообще делать какой-либо публичный поисковик, который будет конкурировать с кем-то, на базе закрытой системы - заранее обрекать проект на неудачу в перспективе. Там, где есть конкуренция, там обязательно придётся "довешивать" к поиску новые фичи и фишки, причем регулярно и адекватно конкурентам. С закрытой чужой системой это делать напорядок сложнее. А nutch и lucene через год заматереют сильнее, да производители выпустят новые линейки писюков помощнее, но вот вы свой код через год не откроете, да и в TREC участие тоже не примите... :)

Leom:

Кстати а с Maxime вы не близнецы-братья? Просто у вас обоих большая любовь к букве "E". Типа
- пеар
- кретерий

Ты сначала свои бежавшие запятые сочти, светоч орфографии. :)

"Пеар" тут употреблён примерно как употребляется всем известный ныне "красавчег" 🚬

Leom:

Как раз если бы я не представлял что такое TREC и не понимал что для этого надо усилия программистов котороым и так есть чем заняться, то и не предлагал бы вам потестить -- как я понимаю из чистого научного интереса. Коммерческого интереса я просто уверен у вас нет.

Leom, скажите, пожалуйста, а от чего вы вами же поднятый вопрос тестирования вашего же поисковика столь упорно сводите к моему коммерческому интересу ? Можно это рассматривать как подсознательное желание таки уйти от больного вопроса релевантности ? :)

Leom:

Maxime -- если я верно угадал вы не занимаетесь коммерцией, иначе бы паром вы это не считали.......

Теперь для чего я сюда запостил. Чтобы коллеги которые изъявят желание потестить и покритиковать (не абстрактно а после тестировки) начали это делать :)

Что-то мне подсказывает, что предложение бесплатно потестить что-то в TREC - это именно пеар, причём дешевого пошиба, бо собеседник мало представляет что это такое...

У поисковых машин два главных критерия качества: релевантность поиска и скорость ответа на поисковые запросы. Почему вы педалируете именно скорость индексации, мне с научной точки зрения не понятно, а вот с коммерческой - еще как, у товара пиарят лучшие стороны, а вот худшие - как раз скрывают и с конкурентами не сопоставляют :)

Всего: 237