Зеркало

M
На сайте с 23.11.2006
Offline
37
453

Добрый день, есть сайт ****.com.ua зеркало [[[[.org.ua Yandex проиндексировал ****.com.ua 1131 стр и продолжает индексировать, а [[[[.org.ua тут 200 стр. Как написать yandex(у) что это зеркала, и гууглу а то в гуугле ****.com.ua каждый день стоит все меньше и меньше проиндексированных страниц.

S
На сайте с 30.12.2006
Offline
30
#1

Создай файлик robots.txt со следующим содержанием:


User-Agent: Yandex
Disallow:
Host: ****.com.ua

User-Agent: *
Disallow:

И залей его в корень [[[[.org.ua И жди... Иногда пару недель, иногда пару месяцев.

M
На сайте с 23.11.2006
Offline
37
#2
Sipaj:
Создай файлик robots.txt со следующим содержанием:

User-Agent: Yandex
Disallow:
Host: ****.com.ua

User-Agent: *
Disallow:


И залей его в корень [[[[.org.ua И жди... Иногда пару недель, иногда пару месяцев.

а вот это зачем User-Agent: *

Disallow: !?

И как Яндекс тогда будет понимать ? тоесть по конкретному запросу он будет выдавать [[[[.org.ua или ****com.ua ?

MASTAKILLA
На сайте с 11.05.2006
Offline
160
#3

User-Agent: *

Host: ****.com.ua

Вот так напишите в robots.txt, в директиве host укажите главное зеркало, и ждите.

S
На сайте с 30.12.2006
Offline
30
#4
marioo:
а вот это зачем User-Agent: *
Disallow: !?

И как Яндекс тогда будет понимать ? тоесть по конкретному запросу он будет выдавать [[[[.org.ua или ****com.ua ?

User-Agent: указывает, какому поисковику это адресуется. Если стоит звёздочка, то адресуется всем. В нашем случае - Яндексу. Почему именно Яндексу а не всем подряд? Просто директива Host: понимается не всеми поисковиками. Например, Гугля по поводу Host: сообщает, что директива не распозналась.

Disallow: даёт указание, какие папки НЕ ИНДЕКСИРОВАТЬ.

Нет указаний - нет и запрета.

Файлик надо залить на [[[[.org.ua

upyrj
На сайте с 17.09.2005
Offline
140
#5
MASTAKILLA:
User-Agent: *
Host: ****.com.ua

Вот так напишите в robots.txt, в директиве host укажите главное зеркало, и ждите.

Есть мнение, что без Disallow не канает. Да и зачем прочим поисковикам читать про хост? Ведь могут понять неправильно, или просто не понять — если там запрещать что-то будете.

Так что Sipaj прав.

А вообще с зеркалами все оченно непросто. Особенно когда поклеятся сайты, да по-кривому. Так что, если нет особых хитрых причин для склейки, просто 301-ым ответом редиректьте на правильное зеркало. Хотя да, для Яндекса будет существовать только основное. 8/

PS пустой Disallow ничего не запрещает. Он вроде как нужен для соответствия стандартам.

Денис Иванов Важно: обменом валют я не занимаюсь.
HoSStiA
На сайте с 18.02.2004
Offline
144
#6
upyrj:
Есть мнение, что без Disallow не канает.

Не мнение, а ответ Платона, что Host: должен следовать после всех Disallow:, в примере приводится пустой. Лучше "перебдеть", чем потом гадать, почему все плохо.

upyrj:
Да и зачем прочим поисковикам читать про хост?

Они все равно не понимают, что такое Host:, но видят его и ругаются в любом разделе (проверьте подобный robots.txt с помощью WebMaster Tools в Google, например)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий