Помогаю с DLE

SpaceInvader
На сайте с 16.01.2013
Offline
29
#11

Доброго времени. Как можно решить проблему попадания вот таких страниц в "HTTP-статус: Ресурс не найден (404)" Яндекса?:

/anime/detskie/komedii/komedii/komedii/koncerti/detskie/

Вот robots (который уже замусолен, чтобы избежать этого):

User-agent: *
Allow: /anime/$
... (другие категории)
Allow: /*.html
Disallow: /autobackup.php
Disallow: /admin.php
Disallow: /*print
Disallow: /user/
Disallow: /backup/
Disallow: /cache/
Disallow: /cgi-bin/
Disallow: /catalog/
Disallow: /page/
Disallow: */page/*
Disallow: /2012/
Disallow: /2013/
Disallow: /tags/$
Disallow: /engine/
Disallow: /engine/go.php
Disallow: /language/
Disallow: /templates/
Disallow: /upgrade/
Disallow: /uploads/
Disallow: /newposts/
Disallow: /lastnews/
Disallow: /favorites/
Disallow: /*subaction=userinfo
Disallow: /*subaction=newposts
Disallow: /do=*
Disallow: /*do=*
Disallow: /?*
Disallow: /copyright.html
Disallow: /rules.html
Disallow: /ruleslogin.html
Disallow: /error.html
Disallow: /statistics.html
Disallow: /addnews.html
Host: *****.ru
Sitemap: http://*****.ru/sitemap.xml

Может быть заменить на такой robots: правильный ли он?

User-agent: *
Disallow: /
Disallow: /copyright.html
Disallow: /rules.html
Disallow: /ruleslogin.html
Disallow: /error.html
Disallow: /statistics.html
Disallow: /addnews.html
Disallow: /tags/$
Allow: /tags/*
Allow: /index.php
Allow: /anime/$
... (другие категории)
Allow: /*.html
Host: *****.ru
Sitemap: http://*****.ru/sitemap.xml

то есть, получается он запрещает всё, кроме главной, категорий, списка по тегам и новостей, или нет?

Спасибо за ответ.

gothtaxi
На сайте с 09.08.2010
Offline
59
#12
SpaceInvader:
Доброго времени. Как можно решить проблему попадания вот таких страниц в "HTTP-статус: Ресурс не найден (404)" Яндекса?:

/anime/detskie/komedii/komedii/komedii/koncerti/detskie/

Вот robots (который уже замусолен, чтобы избежать этого):

User-agent: *
Allow: /anime/$
... (другие категории)
Allow: /*.html
Disallow: /autobackup.php
Disallow: /admin.php
Disallow: /*print
Disallow: /user/
Disallow: /backup/
Disallow: /cache/
Disallow: /cgi-bin/
Disallow: /catalog/
Disallow: /page/
Disallow: */page/*
Disallow: /2012/
Disallow: /2013/
Disallow: /tags/$
Disallow: /engine/
Disallow: /engine/go.php
Disallow: /language/
Disallow: /templates/
Disallow: /upgrade/
Disallow: /uploads/
Disallow: /newposts/
Disallow: /lastnews/
Disallow: /favorites/
Disallow: /*subaction=userinfo
Disallow: /*subaction=newposts
Disallow: /do=*
Disallow: /*do=*
Disallow: /?*
Disallow: /copyright.html
Disallow: /rules.html
Disallow: /ruleslogin.html
Disallow: /error.html
Disallow: /statistics.html
Disallow: /addnews.html
Host: *****.ru
Sitemap: http://*****.ru/sitemap.xml


Может быть заменить на такой robots: правильный ли он?

User-agent: *
Disallow: /
Disallow: /copyright.html
Disallow: /rules.html
Disallow: /ruleslogin.html
Disallow: /error.html
Disallow: /statistics.html
Disallow: /addnews.html
Disallow: /tags/$
Allow: /tags/*
Allow: /index.php
Allow: /anime/$
... (другие категории)
Allow: /*.html
Host: *****.ru
Sitemap: http://*****.ru/sitemap.xml


то есть, получается он запрещает всё, кроме главной, категорий, списка по тегам и новостей, или нет?

Спасибо за ответ.

http://alaev.info/blog/category/cms-i-coding/datalife

тут есть ответ на твои вопросы

kosoff
На сайте с 03.08.2011
Offline
74
#13
kosoff:
здравствуйте. подскажите если на сайте уже есть несколько категорий можно ли добавить еще одну с большим количеством новостей путем импорта XML файла и если "да" то как. Спасибо

а по моему вопросу никто не поможет

купить дубовую щепу (http://bochka01.ru/shepa/chepa_nabor.htm)
дани мапов
На сайте с 06.09.2012
Offline
204
#14
kosoff:
а по моему вопросу никто не поможет

Так сделайте в формате для Phpmyadmin и импортируйте, почему нельзя?

Написание и доработка скриптов (PHP, MySQL, JavaScript, jQuery) (/ru/forum/811046)
SpaceInvader
На сайте с 16.01.2013
Offline
29
#15
gothtaxi:
http://alaev.info/blog/category/cms-i-coding/datalife
тут есть ответ на твои вопросы

У кого ещё какие мысли. Я хочу узнать, второй вариант моего robots можно вообще заливать на сайт, корректен ли он, не закроет индексацию главной? У меня вид главной *****.ru без index.php. Или робот понимает что /index.php = главная, даже если её адрес без php

Второй вариант файла к тому же меньшего размера.

siv1987
На сайте с 02.04.2009
Offline
427
#16
SpaceInvader:
У кого ещё какие мысли.

примерно сойдет, если вам кажется лучше. Лично я не вижу никакой разницы, что теперь эти страницы будут попадать не в 404 а в запрещенные к индексации. Вы бы луче разобрались где у вас прописана относительная ссылка, от чего получается такой урл.

SpaceInvader
На сайте с 16.01.2013
Offline
29
#17
siv1987:
примерно сойдет, если вам кажется лучше. Лично я не вижу никакой разницы, что теперь эти страницы будут попадать не в 404 а в запрещенные к индексации. Вы бы луче разобрались где у вас прописана относительная ссылка, от чего получается такой урл.

siv1987,

1. у меня прописан редирект в .htaccess со страницы типа /anime (прежнее название) на /anime-best (переименованная категория), может в этом всё дело?

2. почему нет разницы, получается робот всё равно будет считать, что на сайте "не порядок".

3. или можно особо не беспокоиться, что эти страницы попадают в 404 Яндекса?

Я вообще не понимаю как движок создаёт такие ссылки, где одна категория повторяется по нескольку раз в адресе! У меня в админ-панели всё настроено.

kosoff
На сайте с 03.08.2011
Offline
74
#18
дани мапов:
Так сделайте в формате для Phpmyadmin и импортируйте, почему нельзя?

а можно поподробнее или ссылочку на инфу где почитать

siv1987
На сайте с 02.04.2009
Offline
427
#19
SpaceInvader:
1. у меня прописан редирект в .htaccess со страницы типа /anime (прежнее название) на /anime-best (переименованная категория), может в этом всё дело?

Нет. Но чтобы с сказать с точностью надо увидеть редирект.

SpaceInvader:
2. почему нет разницы, получается робот всё равно будет считать, что на сайте "не порядок".

Что значит "непорядок"? Я уже говорил в одном подобном топике, эти ошибки носят информативный характер. Ведь вполне нормально что страница запрещена к индексации в роботс, это не означает что у вас "непорядок". Просто может быть, что вы не намерено ее закрыли.

SpaceInvader:
3. или можно особо не беспокоиться, что эти страницы попадают в 404 Яндекса?

Да.

SpaceInvader:
Я вообще не понимаю как движок создаёт такие ссылки, где одна категория повторяется по нескольку раз в адресе!

Читайте про относительные ссылки.

SpaceInvader
На сайте с 16.01.2013
Offline
29
#20

siv1987, спасибо за ответы и терпение =)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий