Алексей, вы что, издеваетесь? "Уточняющий" запрос в основном делают те, кто ищет что-то конкретное, и это уже будет не навигационный запрос, а информационный или транзакционный. ;)
Вообще ваша штука навигационные запросы обрабатывает непонятно как: http://search.i.ua/?q=%EF%EE%F0%F2%E0%EB%FB+%F3%EA%F0%E0%E8%ED%FB
Похоже, что для этого поисковика показателем ранка документа является формальное присутствие ключевых слов в контенте страницы запроса, а это давно уже неактуально.
Запрос как раз совершенно реальный. Гугл, например, справился совсем неплохо:
http://www.google.com.ua/search?hl=ru&q=%D0%BA%D0%B8%D0%B5%D0%B2&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA+%D0%B2+Google&meta=cr%3DcountryUA
В целом я хотел показать, что ищет ваш поисковик пока совсем слабо.
Потестировал немного ваш поисковик.
Пока видна только формальная релевантность - взвешиваете страницы непонятно как.
По типам запросов (запросы случайные):
1) навигационный - киев
http://search.i.ua/?q=%EA%E8%E5%E2&=%C8%F1%EA%E0%F2%FC
Ожидания: список сайтов о городе Киеве
Релевантность: 1/10
2) информационный - Президент США
http://search.i.ua/?q=%EF%F0%E5%E7%E8%E4%E5%ED%F2+%D1%D8%C0&=%C8%F1%EA%E0%F2%FC
Ожидания: список новостных изданий, где упоминается американский президент.
Релевантность - 1/10. Остальные показанные страницы (почему-то первые страницы сайтов?) уже сменили контент, поэтому искомых слов на них нет. Явный перекос в сторону алгоритма вроде PageRank, который дает первым страницам сайтов слишком большой ранк.
3) транзакционный - купить телевизор в Киеве
http://search.i.ua/?q=%EA%F3%EF%E8%F2%FC+%F2%E5%EB%E5%E2%E8%E7%EE%F0+%E2+%EA%E8%E5%E2%E5&=%C8%F1%EA%E0%F2%FC
Ожидания: список интернет-магазинов, где можно приобрести телевизор
Релевантность - 3/10 ссылки
В общем, пока есть над чем работать.
Вот как только вернусь - сразу отпишусь. :)
Еще раз спасибо за поздравления!
Антон, я уже почти две недели с женой в Юрмале. :) В воскресенье прилечу из Риги - тогда.
Огромное спасибо за поздравления!
Это нынче нормальное явление, которое бъет практически всех. Похоже, гугл оптимизирует алгоритмы сбора данных и пересобирает свои индексы заново.
Длится выпадание страниц с января-февраля, так что остается только ждать, когда BigDaddy надоест шалить.
Seventh Son, не совсем понял, почему пост в этой теме. :)
Женька, предлагаю сделать доклад по новому алгоритму Google. Эксклюзив. :)
Нет, Java/1.5.0_06, Java/1.4.1_04 и прочие, который выкачивают известные ТОЛЬКО гуглу страницы. Есть серьезные подозрения, что это фильтры.
По моим темам сайты с качественным контентом резко пошли вверх, остальные только падают. Обновление индекса сейчас довольно странное - качают много, в индекс выкладывают мало, и то бОльшая часть идет во вспомогательный индекс с Supplemental Resuls. Наводит на размышления, что идет глобальная чистка рядов.