1. Подумать/почитать/подумать что может влиять на индексацию, назавем это факторами.
2. Создать табличку с урлами/названиями/тайтлами и т.п тем по вертикали и факторами страниц по горизонтали.
3. Заполнить табличку.
4. Обработать результаты.
5. Проанализировать.
Примерно так. Но это "базовый" уровень.---------- Добавлено 18.03.2013 в 22:28 ----------
а кто-то пишет посты/тексты/статьи, а потом из-за копипастеров отхватывает фильтр.. не пустая трата времени, ага.
Awrora, robots.txt должен быть доступен на "удалаемом" домене-будушем неглавном зеркале в нем должна содержатся в деректива HOST
вот так(измените домен на нужный):
User-Agent: *
Host: www.glavnoye-zerkalo.ru
Редирект нужен 301, постраничный. 302 - "перемешен временно", яндекс его может проигнорировать.
Да, хост укажите и на главном зеркале.
Detecting Spam Web Pages through Content Analysis
На английском, но с картинками :)
там про rd=0 не написано :(
Стоит. и 10 символов
а такие кеи часто можно объединять, разбивать и т.п..
Код уже посоветовали внимательно посмотреть.
Посоветую проверить переиндексировалась ли страница.
Не замечаю такого. Что за тематика?
И по вордстату смотрели, может сезонность?
И ещё вариант- КС-ки, которые вылезли сами по себе, а потом отвалились.
а старые страницы переиндексировались?
А ссылки, трафик?
Занимательная лингвистика в SEO
И кроме БМ25 посмотрите общую формулу (http://download.yandex.ru/company/03_yandex.pdf)- интересный пункт 2.4 Pseudo-relevance feedback. Стоит понимать, что представленный доклад старый.
Единственное- для этого я незнаю готовых программных решений.