у вас страницы с сериями дверей, описание практически не изменяется, пару фраз в характеристиках, яндекс скорее всего исключил их. Такую же тенденцию заметил за последние примерно полгода на клиентских магазинах, из 1000-3000 товаров, в индексе обычно 300-800 страниц.
При этом заметил, чем меньше описания товара, тем лучше индексируется.
К примеру у вас на страницах текст на 500 символов, а меняется всего 100 символов, остальное дубль получается. Если на страницах выводить только эти 100 символов, которые меняются и не дублировать остальной весь текст, скорее всего сайт будет лучше индексироваться. Цифры примерные, но желательно делать описание к позиции не менее 250 символов, не дублируя общие сходные характеристики.
Чистых экспериментов нет, сказанное выше сейчас это более догадка, чем факт. Но есть 1 клиентский магазин, где тайтл товара -наименование обрезанное до 70 символов, а описание повторяет тайтл, только не обрезанный - в итоге 150-250 символов. Как таковых описаний нет, текста на странице мало, но 100% уникальный в пределах сайта. Сайт плотно сидит в индексе уже 4 года и до сегодня, около 2000 товаров, в индексе порядка 1800 страниц.
зачем стреляться? просто покупая практически в слепую в таком случае, можно подписаться на полугодовую-годовую перписку с платонами по поводу снятие бана или АГС с домена. В 90% случаев - это того не стоит.
я обычно пользуюсь yazzle
что было ранее по вебархиву, проверить внешние ссылки и упоминания домена, (в каком контексте), проанализировать информацию - попытаться выяснить вероятность попадания сайта в бан или под фильтр. Если по вебархиву, более или менее хороший контент, без продажных ссылок и не адалт тематика, по внешним ссылкам, тоже "белое и пушистое", проверить историю индексации, если доступна - не смело, но можно покупать. Лучше домен покупать с рабочим сайтом, с индексом в Я и Г от 20-30 страниц.
предположение: 50 на 50 :)
это эхо от проиндексированных смс от мегафона, теперь энтузиасты пытаются выловить еще скрытую информацию. Скоро все утихнет.
скорее всего зеркала с www и без.
восстановить можно с тех областей, на которых не было перезаписи. После удаления, и записи новых данных -восстановить старые не получится.
Не спасет, если вбивать ссылки на удаление - яндекс быстрее наложит фильтр, чем исключить не нужные страницы.
Еще варианты, если категории прогнизируемые, то можно задать запрет в robots.txt на всю категорию с дублями или если есть знания, можете использовать http://devaka.ru/articles/link-rel-canonical
относится как к дублированному контенту и часто приводит к АГС, в данном случае вам лучше ЧПУ настроить так, что бы товар всегда имел вид, например http://site.ru/productID/