В роботсе закройте от индексации сайт:
1. Для яндекса http://webmaster.yandex.ru/delurl.xml
2. Для гугла в инструментах для веб-мастеров следующий путь: Конфигурация сайта/Доступ для сканера/Создать запрос на удаление.
1. Согласен с edgrak - для перелинковки действительно удобнее/лучше с htm(-l) на конце (то есть на страницу).
2. Что касается главной, то тут классическим редиректом.
Ну а как называют сейчас полное или неполное дублирование контента/содержания на страницах сайта, исключенное в результате поиска поисковых систем?
Примеров среди собственных проектов нету. А так... первое что нашел.
Страницы банально могут быть схожими, если к примеру обе новости описывают один и тот же товар, или описание каких-нибудь газовых котлов одинаковое, единственное отличие в размере и внешнем виде (фотографии).
Это тест чтоли?:)
Были случаи (возьмем к примеру интернет-магазин), когда 2-3-..-n страниц в 200 знаков запросто склеивались.
1. По поводу 1000 знаков... Меньше знаков - есть вероятность склейки страниц и прочей нечести. (да и просто как таковая страница с 1000 знаками выглядет более естественной/полноценной).
2. Вторые два вытекают из фильтров ПС (гугла). Если надо, линк найду на англ серч.
Лучше конечно ручками проверить. Можно и в автоматическом режиме проверять:
1. Бесплатными программками:
1.1. Linking The Web (проверит на robots, noindex, находится ли вообще ссылочка на странице...)
1.2. AllSubmitte (модуль – анализатор бирж: количество внешних/внутренних, объем текста и т.д.).
2. Плагинами/стилями мозилы, которые проверят но ноиндекс/ноуфаллоу:
1.1. Page Promoter Bar (noindex проверяет)
1.2. Плагин маула
1.3. В стилях мозилы (C:Program_FilesMozilla_Firefox/RES/forms.css.) прописать подсвечивание и то или иное выделение. К примеру:
a[rel~="nofollow"] {background-color: yellow !important;} noindex {background-color: #ff6600 !important;}
тем самым nofollow у нас подсветится желтым, noindex рыженьким.
3. Платные программки и сервисы (тут их много: sapemaster, webeffector...)
Что касается ограничений при ручном просмотре страниц... Тут на своё усмотрение... Я исходя из своей практики (как правило 90% туфты отсеивается) применяю для страницы и сайта сл. ограничения:
- в индексе Яндекса меньше, чем 50 страниц
- внешних ссылок со страницы больше 5 (внутряк).
– внешних ссылок, включая ссылки в noindex, больше чем 15
– страницы донора нет в индексе нужной ПС
- размер текста меньше 1000 зн
- соседние с вашей ссылочки на "пушистые и халявные тематики" типа (покер, сайты для взрослых, халява, варез...).
- откровенный бредотекст на странице (подчас и копипаст смотрю).
_sega_, отписался в личку:)
Всем доброй ночи:)
Извиняюсь, что вовремя не получилось отписаться:) Родственников пришлось встречать с Мальорки, и как обычно рейс задержали:)
Итак, сегодня вечером мне отзвонился заказчик и сказал что нашел "своё", указав на последнюю работу _sega_. Я рад, что автору удалось угадать идею заказчика.
Итак, победителем конкурса стал _sega_, за что ему жму руку :)
Просьба к andreylabs протранжирить питомца:)
Всем участвующим в конкурсе большое спасибо, ваши идеи были действительно хорошими и любопытными.
Мне приятно, что Вы откликнулись на мою просьбу:) И поэтому впредь обещаю делать конкурсы ещё интереснее;)
_____
С уважением Илья!
Это Я сделал выводы исходя из тех логотипов, которые выбирала сторона заказчика. Возможно ошибочные или поспешные...