Если раньше не занимались прогнозом трафика в этой тематике - ошибетесь здорово. Вообще, рекомендую условия работы оговаривать до начала сотрудничества ;)
Популярность словосочетаний с определенным порядком слов можно уточнить в статистике запросов Google (запрос в [] или "") или Рамблера. Самый точный вариант - дать контекст и посмотреть на ключевые слова входа.
Очень много про "текстовый блок", но суть, кажется, я понял :)
Да, поведенческие метрики - не единственный способ ловить текстовый спам. Помимо этого куча других методов. Собственно, если в ранжирование существенный вклад вносят мономы, то почему не использовать комбинации (произведения) факторов для более эффективного выявления текстового спама? Резюмируя: имхо, использование поведенческих метрик повышает эффективность текстового антиспама. Очевидно, традиционные алгоритмы также "в строю" ;)
Блестяще, в точку :)
2Топистартер: плотность/количество вхождений/длина - 100500 раз устарели. И морально, и технологически. Используйте поведенческие метрики (время сессии/объем документа, например). Яндекс недвусмысленно намекает, а практика подтверждает.
Скорее, наоборот. Сначала их банят, а потом они рассказывают, почему так вышло ;)
У нас все хорошо :)
Блин :) Надо хотя бы терминологию декодеру поставить. Женя, спасибо ;)
Точно, очевидная ошибка :) Сергей, спасибо. Надо больше отдыхать 😕
Возможно. Кажется, исследуемый документ не ранжируется по тексту для данного запроса. Иначе мне нечем объяснить тот факт, что по этому запросу выдача пустая, а при поиске по фрагменту из НПС'а - все замечательно. Есть другие объяснения?
mikes добавил 30.08.2011 в 09:41
Буду признателен за примеры.
Давно уже прочитано. Похоже, для приведенного примера (работа вакансии url:www.yandex.ru), похоже, нет текстового ранжирования: по запросу (работа /+2 вакансии) url:www.yandex.ru документ есть, а по ((работа /(-10000 +1) вакансии) | (работа /(+3 +10000) вакансии)) url:www.yandex.ru - пусто. Соответственно, сниппетовщик в данном случае не при чем.
Верю фактам :) Довольно часто рушу и свои, и чужие теории. Пару дней назад коллеги нашли опровержение гипотезы, позволяющей выявить документы, пораженные по передаче статического веса. Вернее, с гипотезой все хорошо, просто практически она бесполезна, поскольку выяснилось, что документ может быть поражен по передаче стат. веса внутри сайта, но отлично работает "наружу". Жаль, но истина дороже ;)
А что, сейчас поиск не использует алгоритмы семейства tf*idf для текстового ранжирования по анкор-листам? ;)
С тем, что не стоило цеплять тему НПС'ов, не посмотрев ее внимательно, я согласен. Экспромт, что поделаешь. Предлагаю считать это упущением ведущего, т.е. моим :) Если серьезно: то, что ссылки работают, очевидно. Также очевидно, что эффективность связок донор:анор:акцептор различна. Разговор про оценку влияния ссылочного по НПС, наверное, получился сырым и преждевременным.
PS. За интересные примеры - спасибо. Кстати, акцепторы находятся без НПС, если искать, отключив ссылочное (сорри, эту недокументированную особенность палить не буду - начнут парсить и ее банально прикроют). Это означает, что документ релевантен и по тексту, и по анкорному. Возможно, логика проста - показывать НПС или нет определяется по вкладу текстовых и ссылочных в итоговый балл. К сожалению, цифирек релевантности у меня нет, не парсил, так что проверить эту штуку не могу.
Аудитория есть, это видно по тысячам просмотров и сотням комментариев. Что интересно - дурных вопросов от "школоты" фактически нет. Я думаю, мы делаем неплохой продукт для думающей аудитории. Не идеальный, конечно, это видно по этому топику, но явно неплохой ;)
Мы открыты :) Если Вам есть что рассказать - приходите, буду рад содержательному разговору.
Согласен :)