На это можно взглянуть с другой стороны. Если запрос популярный, можно гарантировать, что я буду не первым web-мастером, оптимизирующим страницу. Следовательно, релевантных (с точки зрения поисковика) страниц в базе будет содержаться немало, и если какие-то из них будут не на первом месте, то, в основном, из-за Link Popularity. После этого можно сделать вывод, что первая страница в top-10, на которую число ссылок заметно меньше, чем у других, и есть близкий к оптимальному вариант для подмены.
Естественно "лобовой" метод подбора страниц для клоакинга будет работать только для популярных запросов, так как на редкие запросы может вообще не быть оптимизированных страниц.
Я хочу также заметить, что вне собственно текста страницы на релевантность (кроме уже обсуждавшегося LP) влияет немало других факторов:
1) новизна страницы -- чем дольше существует, тем релевантней;
2) число переходов пользователей по этой ссылке;
3) в Апорте, например, на релевантность страницы влияет и текст ссылок, которые указывают на данную страницу;
и т.д.
Резюме: создание "идеальной" страницы практически нереально, если менять только текст страницы, что ограничивает применение метода маскировки (он же "клоакинг") только средне- и малопопулярными запросами, где объективно оценить активность пользователей или число ссылок на сайт довольно трудно, т.к. слишком велика погрешность из-за случайностей.
Количество ссылок на сайт влияет не только на рейтинг, но и на возможность индексации в целом. У меня есть интересный график, показывающий вероятность индексации разными поисковиками в зависимости от того, сколько ссылок стоит на данный сайт. Так, если на сайт нет ни одной ссылки, вероятность индексации меньше 0,1. При наличии хоть одной ссылки она выростает до 0,12...0,3, в зависимости от поисковика. Когда число ссылок увеличивается до 21..100, то вероятность индексации составляет около 0,7 для всех поисковиков, только у Nothern Light примерно 0,9 да у Infoseek -- 0,85.
Скажи, зачем оптимизировать прочность двери, если ты знаешь, как вскрыть замок за 3 секунды? Так и с клоаками: не нужно подставлять поисковику никаких doorway. Просто выдавай ему ту страницу, которая занимает первую-вторую строчку по интересующему тебя запросу. Она может содержать ключевые слова в заголовке, может не содержать, это неважно, главное, что алгоритмы поисковика выбрасывают ее на первое место.
Самое забавное и обидное, что я сам придумал метод клоак в начале этого года, и только сегодня обнаружил, что эта идея уже активно эксплуатируется. Вот что я писал в феврале в e-mail переписке:
=== Cut ===
Пока писал Вам письмо, я придумал отличный метод - чур не разглашать другим. Это метод паразитирования. Как это? Усыпляете совесть, слово в слово копируете содержание самой первой страницы из результатов поиска, вдумчиво (чтобы не повредить рейтингу) корректируя лишь заголовок и первый абзац. Говорите поисковику индексировать, а когда индексация сделана, меняете содержание страницы на требуемое. Так как переиндексации не так уж часты (даже у оперативного российского Яндекса они занимают 2-3 недели), то до следующей перерегистрации вы будете в Top-10 с большой вероятностью. НО! Если Вы совесть случайно усыпили окончательно, а хостинг у Вас платный, пишите скромную программку, которая продолжает выдавать поисковикам ту самую "лжестраницу", в то время как пользователи видят истинное содержание. Я исхожу из предположения, что раз счетчикам удается игнорировать запросы поисковиков, значит их легко отличить. Более того, почти наверняка можно отличить по запросам разные поисковики, выдавая каждому свою "top-1"-страницу.