По поводу резкого изменения поисковой выдачи 20 января

N
На сайте с 02.03.2009
Offline
51
#51
Alex Klo:
кстати, тут пришла в голову мысль:
пока у Яндекса не будет глагола, аналогичного погуглить, то и выдача будет такая же... :)
словоформа пояндексить как-то пока не прижилась...

от чорт, самое главное то забыли :D хотя 'пояшить' вроде неплохо звучит, лучше, чем заслуживает их выдача :)

.
john2007
На сайте с 26.03.2007
Offline
173
#52
zZmeIOka:
basilic, ну если Polosat и неправ, то ненамного. У меня выборка из 50 сайтов, те, у кого по мире тошнота больше 8 - улетели, остальные ровно. Возможно, как раз ваш пример исключение. Хотя надо дождаться следующего апа конечно, глюков никто не отменял. И немного непонятно, если принять эту гипотезу, почему улетели не все запросы - это можно списать на гео. Например, вот пример, 2 и 12 сайты (оба бидэшные) всегда стояли рядом в топе, сейчас разлетелись. Продвигались по одним принципам.

Подтверждаю, по моим проектам, как это ни странно, тоже улетели проекты с большой "тошнотой".

Однако, вопреки бытующему мнению "тошнота", как было определено Минычем или ХРНС, и по которая расчитывается на text.miratools.ru мерой спамности текста НЕ является, потому, как в формуле не учитывается длина текста.

В самом деле, неужели текст с 10 одинаковыми словами (предположим, что это слово самое частотное) при количестве слов в тексте 100 менее заспамлен, чем текст с 50 одинаковыми словами и общем количестве слов 10000? Хотя у второго текста тошнота будет больше!

Похоже в Яндексе слегка забыли, зачем придумали "тошноту", и оптимизаторы настолько убедили их, что "тошнота" - мера заспамленности страницы, что включили "тошноту", как средство борьбы с оптимизацией текстов под ключевики 😂

Совершая ошибки, мы не только учимся их не повторять, но и учимся прощать такие же ошибки другим... (с)
Rokfeller
На сайте с 18.03.2009
Offline
27
#53
CatRegist:
Текст, который дублируется по всему сайту. ИМХО разумеется.. правду знает только Яша.

Это да 🚬

Оптимизатор в Интернете - как Промысловый охотник в Сибири
G00DMAN
На сайте с 19.04.2008
Offline
122
#54
john2007:
Подтверждаю, по моим проектам, как это ни странно, тоже улетели проекты с большой "тошнотой".

Не, даже на небольших выборках это не подтверждается. :(

Раз Яндекс сузил область поиска причин вылета (за спам-текст), проанализировать стало проще.

Я взял чуть меньше сотни пар [запрос,документ], сейчас вроде модно стало такими парами оперировать. :D

Документы были свеже-вылетевшими далеко по соотв. запросам, их любезно подкинули коллеги, ну и своих было немного, к сожалению. :)

Проверялись следующие гипотезы выкидыша:

1. По длине документа.

2. По абсолютному количеству вхождений (что аналогично "тошноте").

3. По относительному количеству вхождений (плотность).

4-5. То же, что и 2-3, но без учета словоформ.

Параметры из 1-5 проверялись как по своим абсолютным значениям, так и по отклонению от среднего в топ-10, -20, -30.

Выводы пока не утешительные - хорошей корреляции не обнаружено. Более того, в топах присутствуют документы с гораздо более "выдающимися" показателями. Это говорит о том, что алгоритм спамности не так прост, как нам хотелось бы. Яндекс применил боле сложные метрики, выявить их будет ни разу не легко.

Илья Зябрев, AlterTrader Research Ltd. Последние статьи: Об отмене ссылок в Яндексе. (www.altertrader.com/publications38.html)|Поведенческие факторы (формулы) (www.altertrader.com/publications36.html) Жадные алгоритмы Яндекса. (www.altertrader.com/publications20.html)|MatrixNet для «чайников». (www.altertrader.com/publications19.html)
CR
На сайте с 29.10.2005
Offline
198
#55
G00DMAN:
Выводы пока не утешительные - хорошей корреляции не обнаружено. Более того, в топах присутствуют документы с гораздо более "выдающимися" показателями. Это говорит о том, что алгоритм спамности не так прост, как нам хотелось бы. Яндекс применил боле сложные метрики, выявить их будет ни разу не легко.

G00DMAN, а как же ваш труд из подписи:

G00DMAN:
«Снежинск» - объяснялка и мои первые выводы.

и его вполне недвухсысленная цитата:

Например, для пары «запрос-документ» число прямых вхождений запроса в текст документа или в анкор-файл документа могут быть параметром в сотнях функций. Это говорит о том, что реальный вклад таких прямых вхождений для конкретного документа вычислить очень сложно даже разработчику алгоритма, тем более, что коэффициенты ak могут меняться после каждого обучения, да хоть и 10 раз в день.

источник

Снежинск во всей своей красе! Просто немного скорректировали за неделю без апов обучающую выборку и все встало на свои места (сразу со ввода снежинска эта тема была, но не во всех запросах далеко), ИМХО. То что это слало явно только сейчас для многих - загадка.

С Уважением, Евгений
G00DMAN
На сайте с 19.04.2008
Offline
122
#56

CatRegist, да я вообще не уверен, что спам-фильтр сидит внутри MatrixNet. Для того, чтобы это было правдой, асессорам нужно разметить огромное количество сео-документов, с отловом спам-текстов и вынесением им приговора "из топа гэть!". Сомнительно, что сейчас асессорам до этого дело есть, им бы региональную выдачу как-то разметить...

zZmeIOka
На сайте с 30.05.2007
Offline
269
#57

Если изменения касаются текстов, то мы все еще легко от(б)делаемся. Тексты на менее тошнотные поправить проще всего. В принципе, если бы это было так, я бы лично был только за - надоело писать и читать всякий переспамленный бред. Который, однако давал результат.

G00DMAN, в топах остались заспамленные сайты, это верно. Очень небольшой процент - примерно десятая часть.

Лично я очень не завидую раскрутке.ру 😂

john2007, да, мерить переспамленность тошнотой без учета общей длины текста - это бред. Вряд ли в Яндекс сидят идиоты, правда же? Возможно есть некое понятие "текста для пользователя", т.е. стандартный объем текста, который может переварить стандартный юзер, и если робот видит простыню, вдвое и более превышающую этот стандарт, с высокими показателями плотности ключа, отсеивает такие страницы. В больших документах для пользователя обычно плотность ключей минимальна.

Пример отвала простыней. Особенно смотрим 2, 5, 7 и 9.

chinatechnika
На сайте с 03.03.2009
Offline
96
#58
Shabash85:
А чем например сайт в первой десятке полезнее сайта во второй десятке, представляете бывает что только кол-ом вхождений на станице

Да ладно. Количество вхождений уже давно не имеет приниципиального значения в конкурентных запросах.

Тут есть монгольский кашемир (https://msk.mongolshop.ru/) Свой проект: http://www.chinatechnika.ru/ (http://www.chinatechnika.ru/)
zZmeIOka
На сайте с 30.05.2007
Offline
269
#59

Влияние гео на вылет не подтверждается пока.

Интересно вот что, есть у меня несколько сайтов, продвигающихся по группе схожих запросов разной частотности и конкурентности, условно ВКВЧ - межкомнатные двери, железные двери, НКНЧ - стеклянные двери, хрустальные двери и т.д. Так вот, повылетали везде именно ВКВЧ, хотя, если принять гипотезу о тошноте, слово "двери" также встречается и в низкочастотниках. Все запросы геозависимы.

kolobok74
На сайте с 29.01.2006
Offline
267
#60
chinatechnika:
Количество вхождений уже давно не имеет приниципиального значения в конкурентных запросах.

То-то у многих в конкурентных тематиках простыни текста висели... От нечего делать...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий