Vyacheslav Tikhonov

Рейтинг
130
Регистрация
27.01.2001
Должность
Developer
Интересы
search engines, bots, information retrieval, data mining
Master's Degree in Computer Science
но "Киев" я никогда не набираю, обычно "Киев" используется в паре с другим словом, например, "погода в киеве", или "афиша киева", или "история киева". Просто "Киев" набирают ленивые, а потом все равно делают второй, уточняющий запрос

Алексей, вы что, издеваетесь? "Уточняющий" запрос в основном делают те, кто ищет что-то конкретное, и это уже будет не навигационный запрос, а информационный или транзакционный. ;)

Вообще ваша штука навигационные запросы обрабатывает непонятно как: http://search.i.ua/?q=%EF%EE%F0%F2%E0%EB%FB+%F3%EA%F0%E0%E8%ED%FB

Похоже, что для этого поисковика показателем ранка документа является формальное присутствие ключевых слов в контенте страницы запроса, а это давно уже неактуально.

Это не совсем правильный запрос. Даже яндекс не может по нему дать нормальную релевантность, если ожидать инфу о городе.

Запрос как раз совершенно реальный. Гугл, например, справился совсем неплохо:

http://www.google.com.ua/search?hl=ru&q=%D0%BA%D0%B8%D0%B5%D0%B2&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA+%D0%B2+Google&meta=cr%3DcountryUA

В целом я хотел показать, что ищет ваш поисковик пока совсем слабо.

Потестировал немного ваш поисковик.

Пока видна только формальная релевантность - взвешиваете страницы непонятно как.

По типам запросов (запросы случайные):

1) навигационный - киев

http://search.i.ua/?q=%EA%E8%E5%E2&=%C8%F1%EA%E0%F2%FC

Ожидания: список сайтов о городе Киеве

Релевантность: 1/10

2) информационный - Президент США

http://search.i.ua/?q=%EF%F0%E5%E7%E8%E4%E5%ED%F2+%D1%D8%C0&=%C8%F1%EA%E0%F2%FC

Ожидания: список новостных изданий, где упоминается американский президент.

Релевантность - 1/10. Остальные показанные страницы (почему-то первые страницы сайтов?) уже сменили контент, поэтому искомых слов на них нет. Явный перекос в сторону алгоритма вроде PageRank, который дает первым страницам сайтов слишком большой ранк.

3) транзакционный - купить телевизор в Киеве

http://search.i.ua/?q=%EA%F3%EF%E8%F2%FC+%F2%E5%EB%E5%E2%E8%E7%EE%F0+%E2+%EA%E8%E5%E2%E5&=%C8%F1%EA%E0%F2%FC

Ожидания: список интернет-магазинов, где можно приобрести телевизор

Релевантность - 3/10 ссылки

В общем, пока есть над чем работать.

Писал бы побольше с фотографиями

Вот как только вернусь - сразу отпишусь. :)

Еще раз спасибо за поздравления!

Антон, я уже почти две недели с женой в Юрмале. :) В воскресенье прилечу из Риги - тогда.

Огромное спасибо за поздравления!

Только у меня такие глюки или ещё кто наблюдал?

Это нынче нормальное явление, которое бъет практически всех. Похоже, гугл оптимизирует алгоритмы сбора данных и пересобирает свои индексы заново.

Длится выпадание страниц с января-февраля, так что остается только ждать, когда BigDaddy надоест шалить.

Seventh Son, не совсем понял, почему пост в этой теме. :)

Женька, предлагаю сделать доклад по новому алгоритму Google. Эксклюзив. :)

Тоесть, что за ява боты? Те которые из под мозиллы ходят?

Нет, Java/1.5.0_06, Java/1.4.1_04 и прочие, который выкачивают известные ТОЛЬКО гуглу страницы. Есть серьезные подозрения, что это фильтры.

Откуда такая информация? Они вроде только-только собираются вводить. Новость недельной давности.

По моим темам сайты с качественным контентом резко пошли вверх, остальные только падают. Обновление индекса сейчас довольно странное - качают много, в индекс выкладывают мало, и то бОльшая часть идет во вспомогательный индекс с Supplemental Resuls. Наводит на размышления, что идет глобальная чистка рядов.

Всего: 847