Vyacheslav Tikhonov

Рейтинг
130
Регистрация
27.01.2001
Должность
Developer
Интересы
search engines, bots, information retrieval, data mining
Master's Degree in Computer Science
Это был технический сбой, который быстро поправили. Часть индекса (что-то вроде домена .com если можно так сказать) некоторое время отсутствовала в поиске.

Да нет, Илья, информация в индексе как раз присутствовала, только указывала она на другой сайт. ;) Если я правильно понимаю процесс, где-то сбойнули таблицы ретрансляции идентификаторов сайтов при сборке основного боевого индекса из промежуточных, такое бывает. Просто так lib.ru явно выплыть на втором месте не мог.

Но дело не в этом.

Сейчас выдача Яндекса имеет довольно ясно выраженный характер - она становится навигационно-информационной.

То есть по возможности десятка сайтов в выдаче вверху состоит из нескольких сайтов, хорошо отвечающих на навигационный запрос (ссылка на стартовые страницы), остальные призваны показывать сайты, которые должны удовлетворить пользователя, если запрос был информационным или транзакционным (здесь главное - контент, поэтому ссылка на внутренние страницы, причем глубокие).

Соотношение навигационных/информационных сайтов, по-видимому, зависит от конкурентности запроса, оценить которую можно элементарно - достаточно получить общее количество страниц и количество сайтов. Понятно, что если сайтов относительно мало, а страниц много, то тут явно не обошлось без внешнего вмешательства. :)

Если же и сайтов много, очевидно, что запрос навигационный, поэтому здесь определяющими факторами будут цитируемость и ссылочное ранжирование.

P.S. Особое спасибо за запросы icq и aol, таки пофиксили.

Господам из Яндекса: может вы коэффициентики по ссылочному ранжированию еще немного подтянете? :)

Даже близко в выдаче не видно ни icq, ни aol.

Надо бы пофиксить :)

5 мин. назад не было

Теперь понятно, с какой внимательностью в Яндексе читают этот топик?

:) Ничего там не было, конечно. 3 минуты - и все пофиксено, так что сбрасывайте свои запросы :)

P.S. Кстати, и yahoo только что появился.

Последний апдейт Яндекса, конечно, очень впечатляет.

Сайт Microsoft вообще забанили, видимо, из-за черезчур высокого индекса цитируемости. :)

Yahoo тоже отправлен в ссылку за первую десятку страниц. И правильно, пусть в Директе рекламу покупают, нечего тут светиться :)

Самое удивительное, что и Google нынче отождествляется с "терминами и жаргоном интернета", взятыми с lib.ru (2 место). При этом, что самое интересное - никаких упоминаний google там нет, зато какое "строгое соответствие". Ни дать, ни взять - исскуственный интеллект, о котором так много говорили и писали в последнее время :)

если в настройках поиска задать какую-либо определенную тему

Понял - подправил.

Почему сбрасывается "темы" при переходе на другую страницу результатов ?

Какие темы и где сбрасываются? Запрос и версия броузера?

ранжирования или релевантости???

Ранжирование - это алгоритм определения соответствия поисковых образов документов, хранящихся в базе искалки, и запроса пользователя.

Релевантность - субъективная оценка соответствия найденного документа запросу, может быть определена только человеком, но не машиной.

Поищите по форуму, должны быть более полные определения.

5%

С тем же успехом можно сказать, что и 7%, и 10% :) Это же не основной параметр ранжирования.

Хм, и то и другое там есть, и уже достаточно давно. Либо вы смотрели ну очень древнюю версию, либо таки не прочитали документацию по настройке - сниппеты надо настраивать, чтобы их иметь, нужно включить сохранение сжатых копий проиндексированых документов.

Да, в последний раз смотрел исходники года два назад, потому и спросил. Слишком часто смотреть вредно :)


А что есть "координатный индекс" ? Яндекс всего 5 страниц выдаёт с этой фразой

Я имел в виду proximity search, позволяющий искать по фразам с учетом взаимного расположения слов. Просто не знаю, есть ли это сейчас у mnogosearch, в тех версиях, которые я видел, в результатах поиска не было нормальных сниппетов (отображается только начало документа), что говорит о том, что координатного индекса все-таки не было.

Насколько я могу судить, в mnogosearch хранятся идентификаторы документов, а не позиции самих слов в них. Может быть, уже сделали?

скажите, имеется ли у myWebSearch документация на английском языке? Поскольку установкой системы будут заниматься админы, не владеющие русским, это один из факторов выбора.

Нет, на английском документации пока нет.

Всего: 847