Подскажите, как правильно поступить с дублями?

J
На сайте с 26.02.2012
Offline
1
508

Доброго времени суток!

Подскажите пожалуйста, как лучше поступить с дублями страниц?

Есть музыкальный ресурс, в бытность, когда все начиналось и диски были маленькими,

решили после загрузки песни пользователем считать md-хеш файла и, ежели в базе уже мелся файл с таким хешем, новую песню удаляли, а вновь созданную при загрузке страницу ассоциировали с уже существующим файлом.

Результатом сего стало вот такое:

» Алла Пугачова - свеча

» Алла Пугачова - свеча

» Алла Пугачова - свеча

» Алла Пугачова - свеча

» Алла Пугачова - Игра

» Алла Пугачова - Арлекино

» Алла Пугачова - Мне нравится

» Алла Пугачова - Арлекино

» Орбакайте - Пугачова - Опять метель

» Алла Пугачова - миллион алых роз

» Алла Пугачова - миллион алых роз - g.e.s

» Алла Пугачова - миллион алых роз

» Алла Пугачова - Речной трамвайчик

» Алла Пугачова - миллион алых роз

» Алла Пугачова - Речной трамвайчик

» Алла Пугачова - миллион алых роз

Учитывая, что файлы там одинаковые, странички получаются идентичными, но с разными УРЛами.

Сейчас логику уже изменили, новые дубли не создаются, но вот как лучше поступить со старыми?

Сейчас сайт сильно пессимизирован гуглом и ждем месяц с момента извещения яндекса (фильтр - в поиске только 2 страницы).

Не очень ясно, в каких позициях сайт вернется в Яндекс и когда, вот я и ломаю голову:

просто удалить сейчас все дубли и дать переиндексации или городить достаточно сложный велосипед со скриптами проверок и созданием 301 на существующие страницы?

skavr
На сайте с 03.04.2010
Offline
96
#1

Варианты:

1) 301-е

2) 404-е (можно отдавать попробовать 404-й заголовок для страниц, не выдавая на переходной период страницу ошибки визуальную, а оставить то что было, дабы не потерять часть трафа).

3) нужно смотреть структуру сайта - может через "canonical" можно реализовывать.

Что обязательно после этого(для вариантов 1 и 2):

- закрываем в роботсе (если есть параметр)

- удаляем в вебмастере гугли (если есть к чему привязать удаление по параметру, так как по одному УРЛу будет проблемно)

Больше не напишу - голова плохо работает после пьянок, но тут достаточно должно быть... :)

[Удален]
#2
Jeronimo:
Доброго времени суток!

Подскажите пожалуйста, как лучше поступить с дублями страниц?
Есть музыкальный ресурс, в бытность, когда все начиналось и диски были маленькими,
решили после загрузки песни пользователем считать md-хеш файла и, ежели в базе уже мелся файл с таким хешем, новую песню удаляли, а вновь созданную при загрузке страницу ассоциировали с уже существующим файлом.

Результатом сего стало вот такое:

» Алла Пугачова - свеча
» Алла Пугачова - свеча
» Алла Пугачова - свеча
» Алла Пугачова - свеча
» Алла Пугачова - Игра
» Алла Пугачова - Арлекино
» Алла Пугачова - Мне нравится
» Алла Пугачова - Арлекино
» Орбакайте - Пугачова - Опять метель
» Алла Пугачова - миллион алых роз
» Алла Пугачова - миллион алых роз - g.e.s
» Алла Пугачова - миллион алых роз
» Алла Пугачова - Речной трамвайчик
» Алла Пугачова - миллион алых роз
» Алла Пугачова - Речной трамвайчик
» Алла Пугачова - миллион алых роз

Учитывая, что файлы там одинаковые, странички получаются идентичными, но с разными УРЛами.

Сейчас логику уже изменили, новые дубли не создаются, но вот как лучше поступить со старыми?
Сейчас сайт сильно пессимизирован гуглом и ждем месяц с момента извещения яндекса (фильтр - в поиске только 2 страницы).

Не очень ясно, в каких позициях сайт вернется в Яндекс и когда, вот я и ломаю голову:
просто удалить сейчас все дубли и дать переиндексации или городить достаточно сложный велосипед со скриптами проверок и созданием 301 на существующие страницы?

А ничего не делай.:) Оставь как есть.

wwwwww
На сайте с 29.04.2011
Offline
195
#3
Jeronimo:
просто удалить сейчас все дубли и дать переиндексации или городить достаточно сложный велосипед со скриптами проверок и созданием 301 на существующие страницы?

Если есть возможность, тогда делайте 301 или rel="canonical".

Если нет, тогда удаляйте страницы и проследите, чтобы ответ был 404. Ждите.

Гугл не Яндекс, быстрее.

Видишь? Свободная подпись.
N
На сайте с 05.03.2010
Offline
85
#4

+1 за rel="canonical". :)

J
На сайте с 26.02.2012
Offline
1
#5
wwwwww:
Если есть возможность, тогда делайте 301 или rel="canonical".
Если нет, тогда удаляйте страницы и проследите, чтобы ответ был 404. Ждите.

Гугл не Яндекс, быстрее.
wwwwww вне форума Добавить отзыв для wwwwww Пожаловаться на это сообщение

301, похоже, не выйдет - нет признака - это разные УРЛы одной папки, каноникал тоже думал, но это не избавит меня от мусора при отображении, а лепить проверки и грузить ими БД - как-то даже не очень красиво...

Наверное, таки решусь на 404, спасибо!

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий