Неправильная структура сайта в ЯВМ нужна помощь, сложная ситуация

ИА
На сайте с 12.02.2014
Offline
63
498

Доброго времени суток.

Помогите решить, в чем может быть проблема.

Имеется сайт. Сайт HTML, самописный, без CMS.Так вот, несколько месяцев назад заметил, что стало увеличиваться количество загруженных страниц в ВМ. Количество же страниц в поиске не увеличивалось, и было равно реальному количеству страниц сайта. Сейчас же и оно поползло вверх.

Начал смотреть в чем дело, в ВМ посмотрел структуру сайта, а она неправильная. Т.е. отображается вот так:

Новости/

Акции/

Каталог/

---Категория 1/

---Категория 2.php/

------Новости/

------Акции/

------Категория 1/

------Категория 2/

------Категория 3/

---Категория 3/

---Категория 1.php

---Категория 2.php

---Категория 3.php

Т.е. есть 3 категории товаров, но почему-то одна из категорий отображается с расширением *PHP, хотя это папка и в нее вложены эти же категории товаров, которые дублируют уже существующие.

В ВМ в разделе "страницы в поиске" и "загруженные роботом" нашел такую страницу, адрес ее выглядит так:

мой_сайт.ру/каталог/категория_1.php/категория/производитель/товар.php

При переходе по ссылке отображается страница категория_1.php, т.е. хвост ссылки не учитывается.

На хостинге структура правильная, т.е. никаких дублей и неправильных вложений нет. Сайту уже несколько лет и раньше все отображалось нормально. Никаких глобальных изменений, которые могли повлиять на структуру, не проводилось.

Кто-нибудь сталкивался с таким? Что это такое и как от этого избавиться?

И еще, в новой версии ВМ скачал файл со списком загруженных страниц, а там ссылки на фотографии товаров - это нормально? А то в Итоге получается реально на сайте ~2 200 страниц, а загружено роботом ~82 000

S
На сайте с 29.09.2009
Offline
133
#1

Бывают часто такие глюки, особенно, думаю, на самописных сайтах, т.к. поисковики не имеют готового шаблона индексирования и создают его сами.

В таком случае Вам нужно создать карту сайта и скормить его яндекс вебматеру и гугл вебмастерс турлс.

А адреса типа мой_сайт.ру/каталог/категория_1.php/категория/производитель/товар.php нужно запретить для индексации в robots.txt через регулярное выражение.

Либо можно сделать так, чтобы страницы типа мой_сайт.ру/каталог/категория_1.php/категория/производитель/товар.php отдавали 404, тогда они быстрее исчезнут из поиска и заменятся корректными.

ИА
На сайте с 12.02.2014
Offline
63
#2

Карта сайта есть и в XML формате и HTML. Странно, что несколько лет Яндексу все нравилось, а тут вдруг что-то пошло не так.

А про запрет индексации я как-то не подумал.... Спасибо. Только попробую сделать по-другому, раз он категория_1.php видит как папку, то в robots.txt пропишу Disallow: /каталог/категория_1.php/, тогда должен все что с хвостами выкинуть.

А то, что фотографии появляются в списке загруженных страниц - это нормально? Или глюк Яндекса?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий