albion

albion
Рейтинг
247
Регистрация
07.10.2005
chaser:
Их и так нет в базе, причем если даже добавить URL "www.сайт.ru/pages/sources.html", на след. день он в базе появляется,

Это скорее всего выдача быстроробота.

chaser:
однако через паруд ней исчезает. Не в курсе, с чем это может быть связано?

1. Возможно есть копия этой странице, которая уже есть в индексе.

2. Запрещена индексация через Disallow: /pages/

3. Какие либо сбои у вас на сервере (проверьте лог - может роботу 404 отдается, или любая другая ошибка).

chaser:
ОК, но как все-таки правильнее:
так - Disallow: /pages
или
так - Disallow: /pages/
?

Если робот воспримет /pages и /pages/ разными урлами, то лучше первое. А так без разницы.

По хорошему при запросе дерриктории сервер сам подставляет слеш в конце.

chaser:
А как я понял из-за них не регистрируются нормальные страницы, типа:
- www.сайт.ru/pages/sources.html и т.п.

Да, кстати при написании "Disallow: /pages/" в индекс не попадут страницы типа: www.сайт.ru/pages/sources.html

chaser:
Disallow: /pages/scripts/downc_log/
Disallow: /pages/scripts/guest_book/

Эти две строки личшее, т.к. выше они уже запрещены.

По сути вопроса: Все изменеия в выдаче происходят после апдейтов (кроме банов сайта, они имхо могут и в междуапье выпасть). Так что ждите 1-2 апдейта, все должно удалиться.

john2007:
но имеет она смысл только после того как Яндекс уже посчитал (склеил) их зеркалами.

Т.е. сначало нужно ждать пока Яндекс склеит, а уж потом сообщать где главное зеркало? 😂

john2007:
Кстати HOST влияет не на все поисковики, а только на Яндекс.

Вы открыли всему форуму глаза. :) А то все здесь считаю что host и для других поисковиков подходит. 😂

Да и еще ваша цитата:

john2007:
При склеяных зеркалах через некоторое время в выдаче будут результаты с com.cyber66.org

Оба домена НЕ являются зеркалами, и соответственно деректива HOST лишняя.

john2007:
Добавление Host в robots.txt - это не склеивание.

Что же тогда означает деректива HOST в robots?

Я всегда считал, что она указывает на главное зеркало. Соответственно Яндекс увидев эту дерективу на одинаковых сайтах, склеивает их и делает сайт указанный в роботсе главным зеркалом.

john2007:
Я не предлагал склеивать роботсом.

Как же, а это:

john2007:
то можно добавить в robots.txt
Host: com.cyber66.org
john2007:
а потом встретил зеркало на com.cyber66.org Яндекс их не склеит?

склеит, но как страницы клеит, а не как сайты (когда по ключевикам сайта выдается только один сайт). Т.е. в выдаче будете по разным ключам встречаться и тот и другой сайт, но не факт что по конкретному ключу будет именно тот сайт, который нужен.

Так что в данной ситуации, либо запрет индексации папки, либо редирект.

Елистратов:
Запретить индексацию директории www.cyber66.org/bbs так как она фактически являеться поддоменом http://com.cyber66.org и не будет геморроя.

Понял о чем вы. Да или так можно сделать.

Елистратов:
(кому интересно и не видел такого стучитесь в асю)

А чем пример выше не подходит?

Елистратов:
Тут поможет роботс...

Да, если только удалить основной домен... 😂

Елистратов:
Запрет индексации и все

А зачем запрещать индексацию сайта: http://www.cyber66.org/ - если сайт не состоит из одного форума?

Всего: 3102