Дык делов-то – тулбаром оценить реальную прокликиваемость ссылок на странице и соответствующим образом распределить по ним пейджранковый демпинг-фактор. Кое-что мне подсказывает, что это давно уже делается, тем более что заявка на патент была подана шесть лет назад.
Ну SEOmoz запустил же, и вроде неплохо получилось: Open Site Explorer.
Подавали запрос на удаление? А "Включить повторно" ("Reinclude") на обработанном запросе нажали?
Ну я так делал (тоже на временных заглушках), ничего страшного не случилось.
А как соотносится посещаемость выпавших и невыпавших страниц?
Цитата из недавнего интервью:
Каноничность в трактовке Google относится к url'ам, а не к сайтам. Т.е. ответа на вопрос в вашей постановке скорее всего нет. Если же сконцентрироваться на слове "проще", то напрашивается редирект :)
Тут совсем рядом тема про "два одинаковых сайта"; желающим держать зеркала с некоторых пор помогает rel="canonical".
Ну если редирект ну никак, то можно rel="canonical" на каждую страницу зеркала (на основной тоже можно, если так проще).
Ну да, принцип тот же, но оттенок смысла получается немного другой, из низкочастотности как бы не следует многочисленность. Стремновато заменять, хотя, наверное, нужно, не писать же "длинный хвост" и т.п.
P.S. Кстати, я чего-то на автомате понатыкал дефисов в long tail, ща подчищу.