Вопрос про склейку сайтов

12
S
На сайте с 28.10.2005
Offline
305
#11

Не стоит пугать всех ботов Allow`ом

RI
На сайте с 07.06.2006
Offline
65
#12
Spartaco:
последний вопрос:

User-agent: *
Allow: /
Host: www.сайт.ru - все хорошо - но мне не нужен сайт с WWW, можно ли в роботсе написать без него, вот так:

User-agent: *
Allow: /
Host: сайт.ru

? Заранее спасибо!

Вы можете указывать здесь хост с префиксом WWW, и без него. Лучше всего вводить в зависимости от того как сайт проиндексирован поисковой системой.

NikoLite
На сайте с 21.05.2007
Offline
99
#13
yanus:
если все стало ясно может просвятите?:
1.какое отношение имеет www.сайт.ru к сайт.ru? это два совершеннно разных домена, не связанных друг с другом, поэтому, добавив www.сайт.ru, вы его проиндексируете, при этом сайт.ru останется зеркалом сайт.com.
2.зачем создавать robots.txt если на сайт.ru Я его просто не прочитает, даже если редирект снят (в базе Я сайт.ru так и висит зеркалом, поэтому не индексирует)? на www.сайт.ru его Я прочитает, но в итоге получиться цепочка зеркал заканчивающаяся сайт.com

ТС заливайте подготовленный сайт на домен сайт.ru и пишите челобитную Платону. пишите обстоятельно, продумайте аргументацию, чтобы в суппорте не посчитали, что вы что-то "химичите". только в этом случае имеет смысл создавать robots.txt, а если точнее, его нужно будет обязательно создавать

Ну ты понаписал. сам хоть понял? человеку требуется просто расклеить сайты, основные требования для данного действия:

1. убрать редирект с сайтов которые не нуждаются в склейке

2. прописать в robots.txt дерективу

Host: xxx.ru* - где сайт xxx.ru является основным сайтом.

при условие, что сайты xxx.ru и xxx.com не являются обсолютно идентичными, при обходе сайтов роботом склейщиком, робот увидит что сайты не являются зеркалами и расклеит их.

вот так

Матрица поймала тебя, освободи сознание и ложки нет...
Spartaco
На сайте с 13.09.2006
Offline
126
#14

Большое спасибо за советы! Гугл у меня оказывается тоже выдает вот этот второй домен зеркалом старого первого ))

Так что написал в роботсе так:

User-agent: *

Allow: /

Host: сайт.ru

RI
На сайте с 07.06.2006
Offline
65
#15

Google по составлению файла robots.txt дает ссылку на этот ресурс http://www.robotstxt.org/orig.html но тут ничего про диррективу Host не написано. Так что в данном случае нужно либо просто ждать, либо попробовать сделать для обоих сайтов SiteMap и скормить их Google.

NikoLite
На сайте с 21.05.2007
Offline
99
#16
RatID:
Google по составлению файла robots.txt дает ссылку на этот ресурс http://www.robotstxt.org/orig.html но тут ничего про диррективу Host не написано. Так что в данном случае нужно либо просто ждать, либо попробовать сделать для обоих сайтов SiteMap и скормить их Google.

Host - директива только для яндекса и гуглом не учитывается, порой бывают такие вещи что в топе по нч попадается 2 сайта - с www и без, на разных позициях

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий