Т.е., если в бэках не морда и есть "Еще с сайта", смотрится есть ли в "Еще с сайта" морда и выводится анкор с морды?
nickspring, в чем различия (1) между высокая точность по Яндексу (vantala), (2) тонкий отсев ссылок с морд (только для Яндекса) (CS Yazzle) и (3) вероятный отдельный инструмент - "максимальные беки по Яндексу" (nickspring)?
Пока нет большого желания заниматься угадыванием слабо-проявляющихся механизмов ранжирования. :)
Не обязательно учитывать "на лету", можно оценить насколько сайт использует спамные методы продвижения, чтобы рассчитывать коэффициент типа ТрасРанка, который уже задействовать в расчетах "на лету".
Для начала хотелось бы напомнить общее определение тематики, предложенное Спарком:
Цитата с доклада Яндекса на РОМИП-2006:
Для прохода с тегами c классификацией по каталогу применялись коэффициенты в диапазоне от -0.3 до 0.25
Для коллег, которые не могут поверить в возможность классификации тематической документов, можно еще сослаться на Александра Садовского, который на последней оптимизаторской конференции это подтвердил. Насколько тематика документов задействована в поиске, конечно же, неизвестно, думаю, что вполне могут классифицировать документы на стадии индексирования, а в поиске документам по степени тематической близости с запросом на лету присваивать соответсвующие коэффициенты. Хотелось бы также напомнить о недавнем обсуждении тематики документов.
Честно говоря, не понял, зачем поисковику дважды рассчитывать релевантность по контенту, а м.б. и просто невнимательно просмотрел предыдущее обсуждение. Очень похоже, что релевантностью коллеги из Яндекса оперируют очень разносторонне, например, цитата Михаила Маслова:
MiRaj, могли бы объяснить логику, на основании которой сформулированы эти тезисы?
Актис, АДВ
Не заморачиваюсь глобальными проблемами. Смотрю на термометр, если на нем +10/-10 градусов Цельсия, и одеваюсь соответственно, а почему весенняя погода ползимы в Москве стоит меня мало интересует. Спросите у Платона лучше о ноуиндекс.
Еще и медом страничку помазать, чтобы быстроробот мимо не прошел, а то результаты долго ждать придется. :)
Если это не тег, зачем парсеру его обрабатывать?