Есть такой большой фактор (номер 2 в моей схеме) - релеванстность содержимого документа запросу. Она вычисляется на основе множества подфакторов - внутридокументная частота, вхождение слов фразы в некие теги и атрибуты (title, keywords, description, alt и т.п.), в участки текста выделенные с помощью элементов офрмления (<h1>...<h6>, <b>, <i> и т.п.) и прочая и прочая. Вот в рамках вычисления значения этого фактора и могут использоваться упомянутые вами вещи.
А когда-то в 2000-м этот фактор рулил. :)
Этот фактор если еще и влияет, то очень и очень слабо. Пренебрежимо мало по сравнению с тремя основными.
Наверняка придумывается. Только выкатывать это никто из стариков не решится. Все юзают старый добрый проверенный PageRank плюс ссылочное ранжирование (associated anchortext). Революцию может сделать только новичок, которому нечего терять. Как Гугль в 1999-м. Кстати, есть альтернатива PageRank'у - алгоритм HITS Кляйнберга (он еще как Hilltop в некоторых работах фигурирует). Его использует Teoma. Но революции тут особой нет - просто статический ранг документа заменен на динамический.
Ну, дык филтры постепенно добавляются, да и любой фильтр довольно быстро вычисляется и обходится. Вон, яндекс сквозняки фильтрует, и что в итоге? Все бросились скупать одиночные ссылки с морд.
Похоже, вектор развития поисковых алгоритмов на данном этапе - фильтрация искусственных ссылок при учете факторов 1 и 3. Тут могут и новые факторы появляться, например, такие как, например, возраст домена (песочница для молодых сайтов в Гугле) и т.п.
А тут должна быть в наличии большая матрица соответсвия всех определяемых тематик.
Ладно, всё, будем считать, что полдоклада я прочёл дистанционно. Поеду в больницу жену проведывать.
Миш, немного не так. На мой вопрос "Умеет ли Яндекс на лету определять тематику документа и используется ли она при ранжировании?" Илья Сегалович ответил, что про ранжирование он ничего не комментирует, а по поводу умеет ли, да умеет, но очень плохо. :)
Еще раз подчеркну, речь идет о тематике документов, а не сайтов!
Скажем так, конкурентность запроса заключается в количестве ресурсов на достижение приемлемой релевантности по нему. :)