Косяк с урлами в выдаче яндекса

12
Lusi
На сайте с 01.01.2007
Offline
169
936

В апреле после очередного АПа столкнулась с не очень понятной ситуацией.

Сайт на CMS Modx.

В поиске яндекса некоторые старые урлы (созданные 5 лет назад) сайта вида

http://www.site.ru/imena.php

заменились на урлы вида:

http://www.site.ru/6

т.е. вместо реальных страниц в выдаче оказались страницы с нумерацией по ID

хотя вся внутренняя часть сайта закрыта от индексации поисковиками в robots.txt

Дублей в поиске нет, и на позиции в поиске замена тоже не повлияла, но ситуация все же напрягает. Что это за косяк? Может такое быть из-за переоптимизации страниц?

Кто сталкивался с подобной проблемой?

Если ты потерял веру в свои силы, найди того, кому хуже и помоги ему.
K
На сайте с 31.01.2001
Offline
737
#1

А редиректы внутри есть?

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
Lusi
На сайте с 01.01.2007
Offline
169
#2

Редиректов нет.

S
На сайте с 07.07.2010
Offline
40
#3
Kost:
А редиректы внутри есть?

а если бы были, то что? :)

SmileP
На сайте с 18.02.2010
Offline
386
#4

Lusi, возможно КМС глюканула и выдала по id.

А какие ответы отдают id-ые страницы?

DO
На сайте с 20.01.2010
Offline
55
#5

покажите роботс (сотрите хост, если он есть).

на самом сайте ссылки на эти дубли присутствуют? простой ответ "нет" тут недостаточен, надо убедиться точно, прогнав сайт, например, с помощью xenu

платно проведу аудит сайта и исправлю все технические проблемы, которые могут мешать продвижению (/ru/forum/594052)
Lusi
На сайте с 01.01.2007
Offline
169
#6

На дубли я проверила сайт программулиной, так что дублей и внутренних ссылок точно нет (насчет внешних - не знаю).

Произошла именно подзамена некоторых страниц, причем очень популярных, посещаемых.

Эта страница http://www.site.ru/imena.php и эта http://www.site.ru/6 отдают посетителю одинаковый ответ, с id-шной страницы ридиректа на главную или на целевую страницу нет. А роботс выглядит так:

User-agent: *
Disallow: /ct/index.php*
Disallow: /go.php*
Disallow: */index.html
Disallow: /?
Disallow: /*?
Disallow: /*&
Disallow: */assets/cache/
Disallow: */assets/docs/
Disallow: */assets/export/
Disallow: */assets/import/
Disallow: */assets/modules/
Disallow: */assets/plugins/
Disallow: */assets/snippets/
Disallow: */install/
Disallow: */manager/
Host: www.site.ru
Sitemap: http://www.site.ru/sitemap.xml
K
На сайте с 31.01.2001
Offline
737
#7
Lusi:
т.е. вместо реальных страниц в выдаче оказались страницы с нумерацией по ID
Lusi:
Эта страница http://www.site.ru/imena.php и эта http://www.site.ru/6 отдают посетителю одинаковый ответ

А почему вы решили, что одна страницы более "реальна", чем другая, если они выдают одинаковый ответ?

Вы дали Яндексу возможность выбрать, какую из двух страниц оставить в индексе и Яндекс сделал свой выбор.

Чем же вы недовольны?

Lusi
На сайте с 01.01.2007
Offline
169
#8

Так id-шные страницы закрыты же от индексации поисковиками. robots.txt составлен по рекомендациям для движка модх, ситуация с появлением в индексе id-страниц по идее вообще не должна была возникнуть. Если что-то сделано неверно и вы это видите - подскажите.

DO
На сайте с 20.01.2010
Offline
55
#9
На дубли я проверила сайт программулиной, так что дублей и внутренних ссылок точно нет

не встречал программулин, которым можно всерьез доверять в этом вопросе. Тем более, что ссылки могли быть когда, проиндексироваться, и, после снятия с сайта, продолжать сидеть в индексе.

дубли надо проверять, практически руками вбивая куски текста с сайта в яндекс, просматривая полный список страниц на сайте, в том числе и непроиндексированных.

я все же также склонен считать что вы что-то упустили.

Lusi:
Так id-шные страницы закрыты же от индексации поисковиками

Судя по приведенному robots - не закрыты.

Lusi:
robots.txt составлен по рекомендациям для движка модх

А это, поверьте, вообще ничего не значит. Каждая вторая CMS пишет, что она seo-оптимизирована, хотя на деле там никакой оптимизацией и не пахнет. То, что у MODx большие проблемы с дублями - не раз испытал на своем опыте.

K
На сайте с 31.01.2001
Offline
737
#10
Lusi:

Так id-шные страницы закрыты же от индексации поисковиками. robots.txt составлен по рекомендациям для движка модх,

И какая именно строка в вашем robots.txt запрещает индексацию страницы /6 ?

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий