Дублирование страниц в поиске

A
На сайте с 17.03.2017
Offline
5
4793

Доброго времени суток уважаемые форумчане. Возникла такая проблема, стали непонятные страницы с дублями появляться. Не понимаю из-за чего, помогите пожалуйста разобраться.

Пример страницы

/montazh-demontazh_reklamnyh_konstrukcij_alpinisty_9645 (нормальная страница)

/montazh-demontazh_reklamnyh_konstrukcij_alpinisty__9645 (появилось нижнее подчеркивание аж два пробела, откуда не понимаю) да еще и залезло все это в выдачу яндекса!

Пишет в вебмастере Страница дублирует уже представленную в поиске страницу /montazh-demontazh_reklamnyh_konstrukcij_alpinisty__9645. Укажите роботу предпочтительный адрес с помощью 301 редиректа или атрибута rel="canonical".

бывает растягивается вот до таких размеров адреса страниц и сразу в выдачу лезут "____________" Пример /domawnij_master____________97152

Откуда это все могло появится, есть способы настроить нормальную выдачу сайта через файл robots.txt?

p/s спасибо всем кто откликнется, сайт погибает и что делать не знаю :confused:

Программа для раскрутки сайта ☛ XRumer (http://www.botmasterru.com/product69500/)
A
На сайте с 17.03.2017
Offline
5
#1

Может кто то просто подскажет как закрыть от индексации страницы в robots.txt в которых более двух нижних подчерквианий? Как составить такую строку Disallow

E
На сайте с 21.09.2009
Offline
283
#2

CMS сайта надо изучать. Это она формирует урлы. Запрет в роботс не поможет.

A
На сайте с 17.03.2017
Offline
5
#3

cms сайта самописная, она не менялась а сбои начали происходить, так же стали в адресах строк появляться ++++ такие знаки и индексироваться яндексом, а может быть проблема связанная с сервером или хостингом, может кто сталкивался?

adel92
На сайте с 04.01.2012
Offline
334
#4

Нет, скорее всего с уязвимостями и взломом в таком случае.

NVMe VDS (https://well-web.net/nvme-vps) с поддержкой 24/7 - от 545 руб.! Безлимитный хостинг (https://well-web.net/ssd-hosting) - от 129 руб.! Домен в подарок! Перенос бесплатно! Заказывайте сейчас, и получите скидку 50%! Заходи! (https://well-web.net/limited-offers)
С
На сайте с 01.05.2008
Offline
132
#5

мне кажется самый простой способ просто прописать canonical на /montazh-demontazh_reklamnyh_konstrukcij_alpinisty_9645 и все вопросы будут решены

ну и соот-но на всех страницах по аналогии

A
На сайте с 17.03.2017
Offline
5
#6
Столбун:
мне кажется самый простой способ просто прописать canonical на /montazh-demontazh_reklamnyh_konstrukcij_alpinisty_9645 и все вопросы будут решены

ну и соот-но на всех страницах по аналогии

Там нереально переписать, страниц тысячи, причем на этих страницах вновь появившихся canonical появляется автоматически, соответственно с этим же новым кривым адресом в строке canonical то есть ситуация хуже некуда.

С
На сайте с 01.05.2008
Offline
132
#7

Это как же нужно написать код что и каноникал на новых страницах тоже будет меняться? ! Вы уверены?

E
На сайте с 21.09.2009
Offline
283
#8
aleggator:
cms сайта самописная, она не менялась

На ПХП? Могли устареть версии. Есть какое то управление? Урлы страниц создаются автоматически?

Как вариант, что то похожее видел, когда система создает доп символ в урле, чтобы не было дубликатов у урла. Ищите программиста который и разберется с системой. Писать в форум бесполезно. Вам никто код не посмотрит, а дело в нем.

A
На сайте с 17.03.2017
Offline
5
#9

"Это как же нужно написать код что и каноникал на новых страницах тоже будет меняться? ! Вы уверены?" - не уверен а точно знаю.

easywind:
На ПХП? Могли устареть версии. Есть какое то управление? Урлы страниц создаются автоматически?
Как вариант, что то похожее видел, когда система создает доп символ в урле, чтобы не было дубликатов у урла. Ищите программиста который и разберется с системой. Писать в форум бесполезно. Вам никто код не посмотрит, а дело в нем.

Урл создается автоматом. Спасибо всем за ответы, буду просить на фрилансерах чтобы исправили.

---------- Добавлено 27.03.2017 в 18:36 ----------

Нашел ошибку это в строке RewriteRule ^advert/.+_([0-9]+)$ /?adv_id=$1&%{QUERY_STRING} [L,QSA,NC]

как раз эти лишние __ и ++++ создаются в адресе строк, гуру подскажите пожалуйста как правильно изменить эту строку?

WS
На сайте с 30.05.2014
Offline
46
#10

От структуры скрипта зависит конечно куда это добавить но если точка входа одна - то попробуйте добавить в index.php в самое начало.

<?php

$new_url = str_replace('__','_',$_SERVER['REQUEST_URI']);

if(urldecode($_SERVER['REQUEST_URI'])!=$new_url){

header("Location:".$new_url);

die();

}

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий