Правильный robots.txt в ДЛЕ

12
VV
На сайте с 24.11.2009
Offline
51
3997

Вобщем такая ситуация:

Довольно частро встречаются на глаза "правильные" robots.txt, в которых запрещают от индексации /pages/. Так вот, насколько это првильно? Вот у меня например есть запросы по которым в топе не сама новость, а именно страница на которой эта новость расположена. Но что происходит потом, когда эта новость перебирается на новую страницу? Я понимаю, что тут происходит какбы дублирование контента, но все-таки уже более 2х лет, и все ок. (слава богу). Так вот, если я например закрою эти страницы, тогда у меня из индекса вылетит около 30% сайта?, что делать посоветуйте. :gm: Или возможно такое, что трафа пойдет больше, т.к на верх могут повсплывать именно новости, а не страницы-путешественницы? Короче я в замешательстве. Кто сталкивался?

Небольшое добавление:

Как ореагируют ПС, если действительно в индексе будет резко на 30% меньше страниц после запрета? Или они не вылетят, а просто перестанут индексироваться? И вообще влияет ли на ранжирование объем сайта в целом?

vandamme
На сайте с 30.11.2008
Offline
675
#1

У меня такой

User-agent: *

Disallow:

User-agent: googlebot
Disallow:

User-agent: yandex
Disallow:
Host: site.com
Sitemap: http://site.com/sitemap.xml

vandamme добавил 27.07.2010 в 23:16

vandamme:
Я понимаю, что тут происходит какбы дублирование контента

нет конечно, этот запрос выпадет либо он со временем переберется на новую страницу

vandamme добавил 27.07.2010 в 23:17

вы хотите запретить индексацию /page/*/ ???

VV
На сайте с 24.11.2009
Offline
51
#2
vandamme:
вы хотите запретить индексацию /page/*/ ???

да, именно об этом, но посмотрела LI статистику, на эти страницы идет почти 10% трафика, вот теперь думаю может не стоит трогать? Хотя очень интересно глянуть как это повлияет на позиции именно конкретных новостей. Могут страницы "перебивать" в выдаче полную новость?

Gaborik
На сайте с 27.03.2010
Offline
80
#4
v.vesta:
влияет ли на ранжирование объем сайта в целом?

Точно незнаю, но предполагаю чем больше страниц, тем лучше.

Главная страница становить более жирным так сказать...

У меня на Dle сайте:

User-agent: *
Disallow: /*print
Disallow: /user/
Disallow: /favorites/
Disallow: /cache/
Disallow: /cgi-bin/
Disallow: /engine/
Disallow: /language/
Disallow: /templates/
Disallow: /uploads/
Disallow: /backup/
Disallow: /images/
Disallow: /autobackup.php
Disallow: /admin.php
Disallow: /?do=lastcomments
Disallow: /statistics.html
Disallow: /index.php?do=pm
Disallow: /index.php?do=search
Disallow: /index.php?do=register
Disallow: /index.php?do=feedback
Disallow: /index.php?do=lostpassword
Disallow: /index.php?do=stats
Disallow: /index.php?do=addnews
Disallow: /index.php?subaction=newposts
Disallow: /tags
Sitemap: http://www.saite.ru/sitemap.xml

User-agent: Yandex
Disallow: /*print
Disallow: /user/
Disallow: /favorites/
Disallow: /cache/
Disallow: /cgi-bin/
Disallow: /engine/
Disallow: /language/
Disallow: /templates/
Disallow: /uploads/
Disallow: /backup/
Disallow: /images/
Disallow: /autobackup.php
Disallow: /admin.php
Disallow: /?do=lastcomments
Disallow: /statistics.html
Disallow: /index.php?do=pm
Disallow: /index.php?do=search
Disallow: /index.php?do=register
Disallow: /index.php?do=feedback
Disallow: /index.php?do=lostpassword
Disallow: /index.php?do=stats
Disallow: /index.php?do=addnews
Disallow: /index.php?subaction=newposts
Disallow: /tags
Sitemap: http://www.saite.ru/sitemap.xml
Host: www.saite.ru

Gaborik добавил 28.07.2010 в 01:23

Облако тегов думаю лучше закрыть.

Как ни крути дубли контента.

Живу одним днём...
Читающий
На сайте с 23.04.2009
Offline
60
#5
v.vesta:
Вобщем такая ситуация:
Довольно частро встречаются на глаза "правильные" robots.txt, в которых запрещают от индексации /pages/. Так вот, насколько это првильно?

Чаще всего не правильно, но зависит от:

- структуры сайта (вложенности каталогов в которых присутствует одна и та же новость)

- вашего шаблона, точнее от того как у вас выводится ссылка на полную новость.

- от краткого содержания новости.

v.vesta:
Как ореагируют ПС, если действительно в индексе будет резко на 30% меньше страниц после запрета?

Потеряете свои "почти 10% трафика" и переколбас по позициям, скорее всего не значительный.

v.vesta:
Или они не вылетят, а просто перестанут индексироваться?

Скорее так: "перестанут индексироваться" и "вылетят"

v.vesta:
И вообще влияет ли на ранжирование объем сайта в целом?

Да, если этот объём в индексе, то влияет положительно.

Ну и мой правильный роботс:

User-agent: *

Disallow: /*print
Disallow: /user/
Disallow: /backup/
Disallow: /engine/
Disallow: /language/
Disallow: /templates/
Disallow: /admin.php // Для отвода глаз, файл переименован.
Disallow: /index.php // Нах не нужен ибо дубль "/".
Disallow: /?do=lastcomments // В принципе тоже контент, нормально индексится, но для юзера польза сомнительна, лучше закрыть
Disallow: /statistics.html
Disallow: /addnews.html
Disallow: */page/1/ // Дубль, при просмотре каталогов.
Host: www.site.ru
Sitemap: http://www.site.ru/sitemap.xml

Это при чистой усановке.

Облако тегов лучше вообще не использовать и закрывать не придется.

Лучший доход для файлового трафика: Без бана АВ (http://goo.gl/F4Lem). А так же здесь (goo.gl/HzCxo) и здесь (goo.gl/B5BDC) Закроем продуктовые магазины за не уникальное содержание ©
A7
На сайте с 14.10.2009
Offline
75
#6

Вот так думаю нормально:

User-agent: *
Disallow: /*print
Disallow: /*user
Disallow: /page/
Disallow: /engine/
Disallow: /cgi-bin/
Disallow: /autobackup.php
Disallow: /backup/
Disallow: /language/
Disallow: /favorites/
Disallow: /statistics.html
Disallow: /newposts/
Disallow: /templates/
Disallow: /tags/
Disallow: /admin.php
Disallow: /index.php?do=pm
Disallow: /index.php?do=search
Disallow: /index.php?do=register
Disallow: /index.php?do=feedback
Disallow: /index.php?do=lostpassword
Disallow: /index.php?do=stats
Disallow: /index.php?do=addnews
Disallow: /index.php?subaction=newposts
Disallow: /index.php?do=lastcomments

Sitemap: http://www.site.ru/sitemap.xml

Host: www.site.ru
Качественный контент под ваше СЯ (http://contentmonster.ru/?r=2739 )
kimberlit
На сайте с 13.03.2007
Offline
370
#7

Alexis766, перед дачей вредных советов почитай мануалы Яндекса про хост.

VV
На сайте с 24.11.2009
Offline
51
#8
Читающий:
Чаще всего не правильно, но зависит от:
- структуры сайта (вложенности каталогов в которых присутствует одна и та же новость)
- вашего шаблона, точнее от того как у вас выводится ссылка на полную новость.
- от краткого содержания новости.
Потеряете свои "почти 10% трафика" и переколбас по позициям, скорее всего не значительный.

Скорее так: "перестанут индексироваться" и "вылетят"

Да, если этот объём в индексе, то влияет положительно.
Ну и мой правильный роботс:
User-agent: *

Disallow: /*print
Disallow: /user/
Disallow: /backup/
Disallow: /engine/
Disallow: /language/
Disallow: /templates/
Disallow: /admin.php // Для отвода глаз, файл переименован.
Disallow: /index.php // Нах не нужен ибо дубль "/".
Disallow: /?do=lastcomments // В принципе тоже контент, нормально индексится, но для юзера польза сомнительна, лучше закрыть
Disallow: /statistics.html
Disallow: /addnews.html
Disallow: */page/1/ // Дубль, при просмотре каталогов.
Host: www.site.ru
Sitemap: http://www.site.ru/sitemap.xml

Это при чистой усановке.
Облако тегов лучше вообще не использовать и закрывать не придется.

Скажите, а чем отличается такой запрет Disallow: */page/1/ , от какова Disallow: /page/1/.? т.е без звездочки? Ведь по сути одну и туже работу выполняют?

eis
На сайте с 18.10.2008
Offline
473
eis
#9

Расскажите мне, зачем закрывать от индексации page?:)

- Здесь я покупаю вечные ссылки на свои сайты! (https://backlinkator.com) - сотни ссылок за копейки
TruthHunter
На сайте с 28.07.2010
Offline
36
#10

У меня толстячки на DLE с тегами живут в Яндексе очень хорошо, и траф именно на теги идет приличный. Думаю, их не всегда нужно закрывать. Тем более у тегов уникальные названия, собирающие траф. А pages, на мой взгляд, тупо дублируют контент(если в shortstory выдается тоже самое, что уже есть в fullstory) и не несут никакой пользы, их можно и закрыть. Если на них идет траф, Яндекс врядли будет их резать, поэтому лучше наверное не делать резких движений, если сайт, как Вы говорите, старый.

Копирайт за $0,5-$1/килосимвол - реально! (http://goo.gl/tyQ0r)
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий