Кто-нибудь представляет себе методику Яндекса по определению одинакового контента?
Не спорю, я только маленький ламер, на вопрос ответите ? с целью просвещения? о великие?
ps годовое вытягивание сетки автоматом, на которой сделаны 4ки-5ки гуля? с аншлагом после 20 мая в Яндексе?
И всетаки, кто-нибудь представляет себе методику Яндекса по определению одинакового контента? Палите тему!
В сутки на 2 го уровня, исключая поддомены, и на 3м также исключая домены. Кстати, фильтр накладывается избирательно на 3 уровень, и если на нем уже есть поддомены под фильтром и их количество превышает какой-то порог, то под фильр попадает и домен 2 го уровня. Хотя это тоже зависит от хостера. Так-же как и с баном.
Чуть больше двухсот,40% процентов из них как раз достигли этого предела, я сам валяюсь, но статистика вешь упрямая. Яндекс всегда говорил, что не учитывает переходов из серпа (хотя техническая возможность на лицо, я думаю Вы знаете о чем я). С другими явными признаками кроме контента и уников связать пока не могу,(те. количество страниц, ссылочное ранжирование, итп). Все домены мои. Еще раз повторю: на старых сайтах проверка(но не понижение) начинается при привышении порога 5500 уников с яндекса. СТРАННО ДА ? Вполне может быть это свойственно только моим ресурсам. Все они позиционируются как доски объявлений. Тематика совершенно различная, есть узкотематические. 80% из пониженых были связаны своим умненьким линкатором(не повторялись, не кольцевались, вроде не непот). Ответы Платона - те-же боянные.
ps: сори, если влез со свом серым рылом в столь уважаемое сообщество белых.
Не, Вы не так поняли, просто старые посещаемые проверяются первыми, старые менее посещаемые позже, новые сразу. Это статистика более чем по 200 сайтам-сателлитам, вообщем-то лишь слегка серым, их объединяло схожесть контента на расстоянии примерно 200-400 СИМВОЛОВ, и в >50% страниц, страниц в индексе было ***** апстену, по причине практически уникального контента, но видать правила ужесточились. Надо сказать янда практически попала в десятку по серым с рерайтом, убытки огромны и продолжают увеличиваться. Гы, но существуют тысячи способов содрать с кошки шкуру..
Я не имел в ввиду что все будут в ж.., просто их там будет больше, и пусть первым бросит в меня камень тот, кто никогда не п***л контент, или не думал об этом.
Фильтр направлен конкретно на это : "Например, дорвеи мутируют в псевдосайты, основанные на бесплатном или краденном контенте (новости, каталоги, доски объявлений, имитация «живого» сайта и т.д.) Мы будем стараться, чтобы сайты, интересные пользователям, и впредь находились на любой запрос.", - все остальное-щепки. Так-что бокал за ДСДЛ!
PS: ... и "самые посещаемые" неравно "самые нужные" неравно "самые полезные" неравно "самые умные" неравно "ДСДЛ (в понимании янды) "
Замечено: фильтр срабатывает при достижении 5500 - 5800 уников с янды на старых сайтах, (созданных до ~~20 мая с.г.), на новых - сразу после 1го апа. И похоже, старые сайты ВСЕ пройдут проверку этим фильтром, первыми берутся самые активные.
Братья, а имеет ли кто-то более точную информацию, ЧТО янда считает одинаковым контентом? Использует ли он синтаксические веса, колдунщика, шинглы или тупо по предложениям?
От себя ляпну, что фильтр явно контентный и использует тот же алгоритм склейки страниц и поддоменов, что и был в янде давным-давно, теперь он глобализовался до доменов, как косо он работал так и сейчас косит.