- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Не корень ли убирается из знаменателя для таких сайтов? А то какой-то удачный симбиоз этой темы с Вашей темой про "Я знаю чем Яндекс ударил по дорам".
Так я в той теме уже про это писал. просто получалось противоречие того о чем мы раньше знали с тем что вот прямо сейчас Миныч сам замерил. Поэтому и стали все проверять заново, не доверяя давним нашим результатам, так как Яндекс что то вроде нового нахимичил.
Про альтернативную формиулу. Мы ее обсосем немного сами, а выложим уже потом, а не сейчас. Накопим статистику так сказать.
Однако, другие эксперименты показывают, что Яндекс модифицирует данную формулу, если сочтет страницу спамной
А может ничего не модифирует, а просто начинает ощущаться влияние параметров, который вы в своей модели не учли? Просто на определенном наборе входных данных вы не видели их влияния, но рано или поздно нактнулись на наборы, где оно есть? ;)
Яндекс анализирует самое частое слово и если это не стопслово, то очень критически к этому относится, вплоть до введения другой формулы для запроса по самому частому слову. Для стопслов и запроса по стопслову, мы проверили, модификации нет.
Читаем первоисточники:
Следует отметить, что в Яндексе используется дополнительный анализ текстов при индексировании для подавления многократного повторения слов в тексте в расчете на повышение ранга документа в выдаче поисковых машин [8].
;)
wolf, по сути цитаты ХРНС и первоисточника не взаимоисключают друг друга. Суть одинакова - есть оценка частотности тех или иных ключевиков, есть некий порог, при котором влияние дальнейших повторов ключевика в тексте либо бесполезно для ситуации, либо ее ухудшает.
Конечно, примитивно, но навскидку - если плотность самого частотного слова в тексте больше x%, то в знаменателе убираем корень.
nickspring, функция должна быть гладкой.
MiRaj, да, конечно, я просто пытался проиллюстрировать суть примитивным примером, о чем и сказал сразу.
wolf, по сути цитаты ХРНС и первоисточника не взаимоисключают друг друга
А я разве его опровергал? :)
nickspring, функция должна быть гладкой.
Кстати, а почему, собственно? Производные от нее брать не надо же. :)
Читаем первоисточники:
Цитата:
Следует отметить, что в Яндексе используется дополнительный анализ текстов при индексировании для подавления многократного повторения слов в тексте в расчете на повышение ранга документа в выдаче поисковых машин [8].
Это скорее всего про такую мелочь как многократное повторение подряд ключевого слова, больше чем 7-8 (лень проверять сейчас прямо) Яндекс не индексировал.
Это не похоже на параметры, которые мы не учли. Больно уж стабильны и первичная формула и "альтернативная" формула при смене рэндомном страниц, которые сравниваем.
На совпадение с точной формой запроса-ссылки-текста не похоже, специально падежи меняем, слова и т.п.
Вот только не пойму одного (простите, если что не так с точки зрения терминологии-не математик я :-( ))- функция текстовой релевантности линейная (непрерывная?), почему же тогда возникают ступеньки?