Да, и требует больше памяти.
Тогда вам сюда: http://www.43n39e.ru/ :)
http://gogo.ru/ - вот и он, поиск от Mail.ru, внизу серпа указывается копирайт.
Ну и используйте длиные 16-ричные числа, например, CEFACDEE78FE, нормальные люди такими словами не разговаривают, а поисковики индексить будут.
Только проспамят эти слова легко, как только узнают для чего они :)
Он уже давно бегает: http://notes.sochi.org.ru/1117/
Брехня, таки спамят. Если не спамят, то поисковик настолько убог, что даже спамерам не интересен :)
Вообще делать какой-либо публичный поисковик, который будет конкурировать с кем-то, на базе закрытой системы - заранее обрекать проект на неудачу в перспективе. Там, где есть конкуренция, там обязательно придётся "довешивать" к поиску новые фичи и фишки, причем регулярно и адекватно конкурентам. С закрытой чужой системой это делать напорядок сложнее. А nutch и lucene через год заматереют сильнее, да производители выпустят новые линейки писюков помощнее, но вот вы свой код через год не откроете, да и в TREC участие тоже не примите... :)
Ты сначала свои бежавшие запятые сочти, светоч орфографии. :)
"Пеар" тут употреблён примерно как употребляется всем известный ныне "красавчег" 🚬
Leom, скажите, пожалуйста, а от чего вы вами же поднятый вопрос тестирования вашего же поисковика столь упорно сводите к моему коммерческому интересу ? Можно это рассматривать как подсознательное желание таки уйти от больного вопроса релевантности ? :)
Что-то мне подсказывает, что предложение бесплатно потестить что-то в TREC - это именно пеар, причём дешевого пошиба, бо собеседник мало представляет что это такое...
У поисковых машин два главных критерия качества: релевантность поиска и скорость ответа на поисковые запросы. Почему вы педалируете именно скорость индексации, мне с научной точки зрения не понятно, а вот с коммерческой - еще как, у товара пиарят лучшие стороны, а вот худшие - как раз скрывают и с конкурентами не сопоставляют :)