Да легко, пишем следующую программу которая,
1) открывает Internet Explorer с стандартными настройками как COM server
2) открывает нужный url
3) делает PrtScr
4) запихивает в программу распознаватель текста типа ABBYY FineReader'а и получает текст с некоторыми ошибками
5) сравнивает полученный результат с текстом в HTML для исправления ошибок распознавания и связи текст на экране -> текст в исходном коде
6) определяет порядок текста + клоакинг
На все про все час работы, и минимальная программа для хитроботов по распознаванию клоакинга готова, конечно для обычной индексации не подойдет (производительность ниже плинтуса), а вот клоакинг и поисковый спам на раскрученных сайтах самое милое дело определять. Я не говорю про то что у Яндекса есть такие же программы (алгоритм конечно корявый), но в принципе написать эмулятор браузера IE (или любого другого браузера) с javascript, css и прочим не особо сложно, другой вопрос производительность такого бота будет ужасной для обычной индексации, но для хитробота вполне нормальной.
P.S. Конечно бороться с банальным переносом div вверх Я не будет, а вот против клоакинга вполне может создать что-то подобное, причем он может проверять только страницы на которых есть подозрение на клоакинг (типа css с display = none) или по несколько страниц с молодых, но раскрученных сайтов.
Ну могут быть просто глюки парсера от такого большого кол-ва ноиндекс. Или Я просто не захочет тратить время на обработку такого большого кол-во ноиндекс. Слышал что при большом кол-ве ноиндекс Я может вообще не индексировать страницы сайта.
Вообще noindex это все таки рекомендация, а не железное правило (как и роботс), так что Я теоретически может и забить на него.
С таким кол-вом noindex странно что страницы вообще индексируются, кстати так в комментариях есть фраза "список товаров по алфавиту" и она не закрыта от индексирования, конечно в теории комментарии HTML не должны индексироваться, но все может быть. Вообще 4 десятка noindex это жесть, оставьте только штук 5 тогда возможно и перестанет индексироваться.
Либо сайт ещё молодой, либо ему не нравится содержание страниц (скажем дублируемый контент), может ошибки при индексации, ставьте Я вебмастер там по крайне мере видно сколько страниц было скачено ботом, сколько попало в поиск, как часто бот приходит на сайт, какие ошибки были при сканировании.
Если бы юзер набрал "видеорегистратор SDRM16 M16" тогда Яндекс его бы поправил и исправил запрос на "видеорегистратор SDRM 16 M16", а так видимо слишком сложно для Я, так как с одной стороны SDRM-16 существует и M16 существует, а вот вместе нет.
P.S. В любом случае это не глюк, а так сказать особенности поиска Я, возможно не очень удобные по нашему мнению, но все равно допустимые.
Все очень просто и логично никакого глюка.
Набираем запрос SDRM-16, смотрим на результаты всего 48 страниц (так как не так часто пишут именно через дефис), дальше смотрим эти страницы, M16 там нет, есть M16 в составе других слов, а так чтобы отдельно слово M16 нет (по крайне мере не нашел). Вывод: запрос неправильный, Я работает нормально.
WhiteSmartFox добавил 21-01-2011 в 15:53
Нет Яндекс должен выдать где встречается и SDRH-16 и M16, а таких нет, все правильно, гугл просто немного по другому работает с дефисом и цифрами, он видимо ищет не только слово SDRH-16, но и SDRH16 или SDRH 16.
давно это почти бесполезно, в лучшем случае чуть чуть нарастите ссылочное, в худшем сильно навредите.
Неужели вы думаете кто-то стал бы платить немаленькие деньги за ссылки если бы прогон по каталогам давал серьезные результаты? Что за вера в всеобщую бесплатную красную кнопку "Переместить мой сайт в ТОП выдачи Яндекса"?
то что каталог делится на тематики не делает ссылки тематическими, тематическими можно считать только с ссылки с сайтов той же тематики что и ваш (или очень близкой).
Сказки, большинство каталогов требуют денег, обратных ссылок, ставят ссылки через редирект и убирают ссылки, если не найдут обратной, а иногда и просто так убирают. К тому же бесплатных каталогов с ТИЦ хотя бы более 100 не так много, страниц у них полно и вес ссылок у них мизерный, у остальных каталогов ещё меньше (многие давно не в индексе ПС).
WhiteSmartFox добавил 21.01.2011 в 01:07
А чем меньше? Прогонами по каталогам можно хорошо посадить сайт, всякие спамерские методы могут вообще абузу вашему хостеру вызвать. Грамотно купленными ссылками в бан загнать сайт практически невозможно, в худшем случае ссылки не будут работать.
WhiteSmartFox добавил 21.01.2011 в 01:10
И дальше вы повторяете идеи своего первого поста совершенно забыв что вам ВСЕ в этом топике говорили прямо противоположенное. Это называется подвести итог?
WhiteSmartFox добавил 21.01.2011 в 01:21
Куда они исчезают? В подпространство что-ли? Пока вы платите зачем кому-то снимать ваши ссылки?
WhiteSmartFox добавил 21.01.2011 в 01:35
Действительно попробуем подвести итог.
1) Покупные ссылки дают возможность быстро и без труда продвигать свои проекты, не тратить время на спам на форумах, каталогах и блогах, а заниматься другими важными делами.
2) Покупные ссылки если их покупать бездумно и неправильно могут не работать и вы потеряете деньги, больше вреда вы ими сайту не нанесете (скорее всего)
3) Прогон по каталогам и обмен ссылками стоит делать аккуратно и думая головой, так как большого эффекта эти методы не дают, а вот навредить молодому сайту могут сильно.
4) Спамить на форумах, блогах, соц.сетях и т.п. во-первых надо уметь, во-вторых, надо просто моря времени. Единственный плюс подобных ссылок они могут приносить не только ссылочное, но и трафик Минус ссылки на форумах, блогах и комментах котируются ПС куда ниже чем ссылки на обычных сайтах (плюс часто они стоят в ноуиндекс, нофлоу или переадресацией)
Вывод: Нет денег и куча времени (как своего, так и времени ожидания успеха проекта) - продвигайте бесплатными ссылками, нет времени и есть деньги - покупайте ссылки.
откройте исходный код страницы и найдите вашу "ссылку", посмотрите на дикую комбинацию
Теоретически можно украсть пароль который вы вводили в панели вебмастера (например сканируя ввод с клавиатуры вашего компа), потом использовать панель (или вычислить фтп) для заливки вредоносного кода (автоматически или вручную), хотя это и менее вероятно чем кража пароля фтп.
Да, но потратив столько денег, что хватило на самого дорогого SEO гуру с самым дорогим бюджетом покупки ссылок лет на 30 вперед, ИМХО. В общем "Красота- страшная сила, но сила денег куда СТРАШНЕЕ!!!" :)