Загружено роботом 16000 страниц, а в поиске 257. Где остальные? И что это за страницы

12
M
На сайте с 26.02.2010
Offline
92
937

Подскажите, обратила внимание, что на одном сайте полузаброшенном в вебмастере загружено роботом 16569 страниц. В поиске - 257 страниц. В поиске - вроде бы логично - статей на сайте 244.

Иду в эти "загруженные" - доля загруженных страниц 100%.

Иду в исключенные страницы. там

ошибка 404 - 4 шт.

запрещены в роботс - 42 шт.

Документ содержит мета-тег noindex - 11

Документ является неканоническим - 192

Понятно, что эти 404 и неканонические - с ними надо что-то делать. Но где остальные 16000? Что это могут быть за страницы?

S
На сайте с 29.01.2006
Offline
404
#1

Marissabel,

Что это могут быть за страницы?

Например, картинки без описания.

zveroangel
На сайте с 14.04.2011
Offline
182
#2

возможно, cms генерирует дубли или какие-то пустые страницы. если их нет в поиске, то и переживать не стоит. если залезет что в поиск - тогда станет понятно, откуда ноги растут.

M
На сайте с 26.02.2010
Offline
92
#3
Scaryer:
Marissabel,
Например, картинки без описания.

так неоткуда же взяться такому количеству картинок. Их там немногим больше чем статей

---------- Добавлено 06.04.2016 в 09:38 ----------

Хотела написать в яндекс спросить, но не нашла подходящего раздела... В индексировании нет ничего про исключенные страницы...

S
На сайте с 29.01.2006
Offline
404
#4

Marissabel, на самом деле может быть очень многое. Навскидку:

1) Сайт взломали и залили 16000 страниц дорвея.

2) Сайт на Джумле с модулем к2, который очень любят спамеры, регистрируя в нем профили со ссылками. Каждый профиль - отдельная страница.

3) Включен форум по умолчанию, про который все забыли, но спамеры его нашли и наспамили 16000 страниц.

Т.к. вы ничего про сайт не сообщили, точнее сказать нельзя.

M
На сайте с 26.02.2010
Offline
92
#5
Scaryer:
Marissabel, на самом деле может быть очень многое. Навскидку:
1) Сайт взломали и залили 16000 страниц дорвея.
2) Сайт на Джумле с модулем к2, который очень любят спамеры, регистрируя в нем профили со ссылками. Каждый профиль - отдельная страница.
3) Включен форум по умолчанию, про который все забыли, но спамеры его нашли и наспамили 16000 страниц.

Т.к. вы ничего про сайт не сообщили, точнее сказать нельзя.

Сайт на ВП. Форума нет.

Может это что-то прояснит: я открыла неканонические страницы. Там странные такие ссылки - и все ведут на главную сайта. Например

/?eaf=coloring-pictures-for-free-l57FZB09qltHkDkobhDmemL2WDqkO_pWYIZ6tnkVF5xYEE41uQFKavHUgq4QJDqGL3rtQayI5vRzZ9ovq4cmbVV5BSfLGNkujd3.jpg

/?eaf=coloring-pictures-for-free-xGqLYuPjoQySdd/8fxsLCSMNs9KATvieiXJBvu86Tg5I86IIyqZvpfOSiZG/E67lHrmN3pq1_DVGgGGaJfut9Jr2sr2H9aGUm_jy6MEjE6PS66DYq6cDkO2Cl1cwouPG6nEWWik1vN6ytkr.jpg

/?eaf=fat-jessica-simpson-picture-_/MBPl/QmklBQ/PyiL1/kcCTW/hW8UMGDtVlFYKZ7786PrD5wrV4cYISnS3B0h4fFGuNmyopykmg6rrTDa9Ja9JsSDmiaQ==2el.jpg

/?eaf=final-fantasy-8-monster-pictures-1z2IKKYP8TryxsuDl5NQSdwzoPUOGvS7pP1gonx8lDIyMRJM140_XxcJshiUpIxqoa_b8Sc6BQcNWX8VMxECppsSXAUjPg==6de.jpg

Вижу что какие то картинки. но у меня нет картинок с джессикой симпсон или монстрами. Там просто фото блюд...

А в конце еще такие неканонические страницы:

/?p=1025&cpage=1

/?p=1074&cpage=1

Эти ведут просто на статью...

SS
На сайте с 17.07.2015
Offline
13
#6

Закройте эти страницы в роботс:

Disallow: /*?p=*

Disallow: /*?eaf=*

M
На сайте с 26.02.2010
Offline
92
#7
StartingSEO:
Закройте эти страницы в роботс:

Disallow: /*?p=*
Disallow: /*?eaf=*

Спасибо. НО они не индексируются. Т.е. в индексе - все те страницы, что и должны быть. А эти в ошибках выскочили - неканонические страницы. ИЛи их тоже в роботсе нужно закрыть?

S
На сайте с 29.01.2006
Offline
404
#8

StartingSEO,

Закройте эти страницы в роботс:

Disallow: /*?p=*

Вообще-то это один из вариантов адресов страниц в Вордпрессе.

---------- Добавлено 06.04.2016 в 15:24 ----------

Marissabel, как сказал StartingSEO, eaf надо закрыть в роботс. Ну и разобраться, что это за фигня. Я погуглил быстренько, но ничего не нашел. Попробовал на своем сайте ваши урлы - тоже перебрасывает на главную страницу.

M
На сайте с 26.02.2010
Offline
92
#9
Scaryer:
StartingSEO,
Вообще-то это один из вариантов адресов страниц в Вордпрессе.

---------- Добавлено 06.04.2016 в 15:24 ----------

Marissabel, как сказал StartingSEO, eaf надо закрыть в роботс. Ну и разобраться, что это за фигня. Я погуглил быстренько, но ничего не нашел. Попробовал на своем сайте ваши урлы - тоже перебрасывает на главную страницу.

Scaryer, StartingSEO, спасибо, я закрою эти. Хотя я думала, что раз их в индексе нет - закрывать смысла нет. А вот как понять, что это за 16000? Хотя бы с чего начать разбираться?

S
На сайте с 29.01.2006
Offline
404
#10

Marissabel, я вчера долго гуглил (гугл даже выдал капчу за подозрительную активность;-)), но так и не понял, что это за ?eaf=. Я бы рекомендовал всё-таки глазами лишний раз посмотреть по ftp папки сайта - не залито ли туда чего-нибудь лишнего.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий