Тестовый и основной домен. Поисковикам плевать на robots.txt и атрибуты.

12
MK
На сайте с 08.07.2012
Offline
17
1131

Здравствуйте,

Домен на основную версию проекта например такой: project.ru

Я не сижу с программистами и не могу локально (вместе сними) тестировать их последние работы. Пришлось залить тот же самый проект на домен: test.project.ru.

Я оказался несколько наивным по отношению к поисковым систем. несмотря на то, что присутствуют метатеги nofollow и noindex - страницы тестового сервера все же индексируются поисковиками, и более того, они даже выдаються на определенные запросы!

Вот что указанно в robots.txt

User-agent: Mediapartners-Google

Disallow:

Allow: /*

User-Agent: Yandex

Disallow: /cms/

Disallow: /reg/

Disallow: /search/

Disallow: /catalog

Disallow: /feedback

Disallow: /*&limit

Disallow: /*pishite_nam

Disallow: /*help

Disallow: /*review

Disallow: /ads/?id_rss=

Disallow: /*qsearch

Host: project.ru

User-Agent: Googlebot

Disallow: /cms/

Disallow: /reg/

Disallow: /search/

Disallow: /catalog

Disallow: /feedback

Disallow: /*&limit

Disallow: /*pishite_nam

Disallow: /*help

Disallow: /*review

Disallow: /ads/?id_rss=

Disallow: /*qsearch

User-agent: msnbot

Disallow: /cms/

Disallow: /reg/

Disallow: /search/

Disallow: /catalog

Disallow: /feedback

Disallow: /*&limit

Disallow: /*pishite_nam

Disallow: /*help

Disallow: /*review

Disallow: /ads/?id_rss=

Disallow: /*qsearch

Как можно работать с тестовым доменом проекта так, чтобы поисковики не индексировали и вообще мимо проходили через него?

Есть одна идея: ограничить доступ паролем..

Что мне делать?

splish
На сайте с 25.01.2011
Offline
114
#1

Отдавайте 404 ответ всем ip адресам кроме вашего.

Делается с помощью .htaccess

SeVlad
На сайте с 03.11.2008
Offline
1609
#2
Misha_Krasnodar:
страницы тестового сервера все же индексируются поисковиками

Что не удивительно, ибо роботс составлен не правильно.

Misha_Krasnodar:
Как можно работать с тестовым доменом проекта так, чтобы поисковики не индексировали

Ямануал гласит:

Disallow: / # блокирует доступ ко всему сайту

Это собсно всё содержимое роботса.

Однако роботс - это всего лишь рекомендация ПСам. Они всё равно гуляют по сайту и индексируют (но в выдачу могут не давать). Надёжнее будет ограничить доступ скажем только с определённых ИП (своих) или да, по паролю.

splish:
Отдавайте 404 ответ всем ip адресам кроме вашего.

503 правильнее будет

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
MK
На сайте с 08.07.2012
Offline
17
#3
SeVlad:
Что не удивительно, ибо роботс составлен не правильно.


Ямануал гласит:



Это собсно всё содержимое роботса.

Однако роботс - это всего лишь рекомендация ПСам. Они всё равно гуляют по сайту и индексируют (но в выдачу могут не давать). Надёжнее будет ограничить доступ скажем только с определённых ИП (своих) или да, по паролю.


503 правильнее будет

Помогите пожалуйста правильно составить robots

OK
На сайте с 24.02.2012
Offline
7
#4

я на денвере всё тестирую, чтоб не попадать в подобные ситуации...

Nomiki
На сайте с 28.03.2012
Offline
117
#5
OLEG_KOM:
я на денвере всё тестирую, чтоб не попадать в подобные ситуации...

Денвер всё не покажет, начиная от настройки прав, заканчивая скоростью загрузки и прочего, проще на сервере.

Может IP Пс-ботов залочить?

Заказать дизайн сайта: nomiki@yandex.ru | Портфолио: behance.net/nomiki | ВК: vk.com/nmk_msk
MK
На сайте с 08.07.2012
Offline
17
#6
OLEG_KOM:
я на денвере всё тестирую, чтоб не попадать в подобные ситуации...

Что это такое? Подскажите чуть поподробнее, пожалуйстаю

OK
На сайте с 24.02.2012
Offline
7
#7

Nomiki, согласен, всё зависит от поставленных целей...

А тупо закрыть сайт (типа тех.работы)? Поисковики не пролезут по идее...

---------- Добавлено 08.07.2012 в 22:08 ----------

Misha_Krasnodar, вот тут посмотрите, может вполне подойдёт для ваших целей...

Nomiki
На сайте с 28.03.2012
Offline
117
#8
OLEG_KOM:
А тупо закрыть сайт (типа тех.работы)? Поисковики не пролезут по идее...

Не пойдет, его же тестить и править вживую надо. Плюс убрать проиндексированные страницы из поддомена.

Misha_Krasnodar:
Что это такое? Подскажите чуть поподробнее, пожалуйстаю

Эмулятор реального хостинга на локальной машине, простая, удобная и полезная вещь: http://www.denwer.ru/about.html

Собственно, бесплатная и ставится в три клика, так что поюзайте обязательно.

SeVlad
На сайте с 03.11.2008
Offline
1609
#9
Misha_Krasnodar:
Помогите пожалуйста правильно составить robots

выше же дал полный робост. См внимательно.

Надёжней закрыть сайт, кинув в .htaccess (создать этот файл если его нет) строки:

Deny from all
Allow from 123.123.123.123
Allow from 155.155.155.155

,где в Allow from перечислены свои ИП-адреса.

Misha_Krasnodar:
Что это такое?

denwer.ru

Nomiki:
Может IP Пс-ботов залочить?

Фиговый и ненадёжный путь. Они могут меняться (количественно и "качественно") и использовать всякие юзер-бары ;)

Nomiki
На сайте с 28.03.2012
Offline
117
#10

SeVlad, согласен, больше гемора получится.

Этот все же тру:

SeVlad:
Надёжней закрыть сайт, кинув в .htaccess (создать этот файл если его нет) строки:
Deny from all
Allow from 123.123.123.123
Allow from 155.155.155.155
,где в Allow from перечислены свои ИП-адреса.
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий