Открой роботс. Используйте noindex - Популярные вопросы про SEO

48

Sead

9 июня 2013, 07:59

#11

Пример:

Имеется страница http://delajblog.ru/acronis-true-image-home

На этой странице есть ссылка "Ответить"

<a class='comment-reply-link' href='/acronis-true-image-home?replytocom=1492#respond' onclick='return addComment.moveForm("div-comment-1492", "1492", "respond", "4112")'>Ответить</a>

Эта ссылка ведёт на адрес

http://delajblog.ru/acronis-true-image-home?replytocom=1492#respond

Этот адрес проверяю в гугл вебмастере:

Заблокировано по строке 15: Disallow: /*?*

Т.е по сгенерированной странице робот не ходит, но индексирует.

В коде на странице стоит

Не пойму: отчего тогда индексация?

Кажется так: робот не может прочитать, что страницу индексировать не нужно, т.к. стоит запрет в robots на посещение этой страницы. Но если убрать Disallow: /*?*, то появятся другие дубли, например, поиск по сайту даст страницу с "?"

---------- Добавлено 09.06.2013 в 13:30 ----------

foxi:
Отдавать на таких страницах не ответ 200, а доступ запрещен. Человеку это не помешает. А боту точно не даст индексировать. Я так с поиском по сайту сделал )

В .htasses так можно?

RewriteCond %{QUERY_STRING} replytocom=

RewriteRule ^(.*)$ /$1? [R=301,L]

Попытки создать свой сайт (http://delajblog.ru/)

Неясная ситуация с сайтом Сайт выпал из индексов Резкое падение позиций в

S3

109

sok3535

9 июня 2013, 09:56

#12

Sead:
Пример:
Имеется страница http://delajblog.ru/acronis-true-image-home
На этой странице есть ссылка "Ответить"
<a class='comment-reply-link' href='/acronis-true-image-home?replytocom=1492#respond' onclick='return addComment.moveForm("div-comment-1492", "1492", "respond", "4112")'>Ответить</a>
Эта ссылка ведёт на адрес
http://delajblog.ru/acronis-true-image-home?replytocom=1492#respond
Этот адрес проверяю в гугл вебмастере:
Заблокировано по строке 15: Disallow: /*?*
Т.е по сгенерированной странице робот не ходит, но индексирует.
В коде на странице стоит
<meta name='robots' content='noindex,nofollow' />
Не пойму: отчего тогда индексация?

еще раз - роботс для гугла запрещает сканирование, а не индексирование - индексирование запрещает метатег noindex. и сюда - http://support.google.com/webmasters/bin/answer.py?hl=ru&answer=156449 там все разжевано, чтобы бот считал метатег на стр не должно быть запретов в роботсе

Sead:

Кажется так: робот не может прочитать, что страницу индексировать не нужно, т.к. стоит запрет в robots на посещение этой страницы. Но если убрать Disallow: /*?*, то появятся другие дубли, например, поиск по сайту даст страницу с "?"

какие дубли?

S

48

Sead

9 июня 2013, 11:04

#13

sok3535:
еще раз - роботс для гугла запрещает сканирование, а не индексирование - индексирование запрещает метатег noindex. и сюда - http://support.google.com/webmasters/bin/answer.py?hl=ru&answer=156449 там все разжевано, чтобы бот считал метатег на стр не должно быть запретов в роботсе

какие дубли?

То что роботс запрещает сканирование, но не индексирование уже вбил себе в долговременную память.

Кажется дошло. Спасибо за рекомендации.

X

70

xarraw

10 июня 2013, 10:05

#14

Asd88:
У меня та же проблема... в роботсе директории запрещены, а в соплях они есть хоть там и пишется рядом, что описание этой страницы запрещено роботсом... как быть?

тупеж полный😂

да открой ты эти страницы в роботс, и метатегами запрети. Гугл же ясно сказал, что страница запрещена роботсом🤪 как только откроешь он ее схавает с метатегами

S

48

Sead

10 июня 2013, 17:25

#15

Теоретический вопрос: почему другие документы запрещенные в robots.txt не попадают в дополнительный индекс Google?

Хотя есть и другие документы, запрещенные в robots.txt. которые также попали в индекс. Почему одни документы попадают в индекс, а другие - нет?

X

70

xarraw

11 июня 2013, 05:58

#16

Sead:
Теоретический вопрос: почему другие документы запрещенные в robots.txt не попадают в дополнительный индекс Google?
Хотя есть и другие документы, запрещенные в robots.txt. которые также попали в индекс. Почему одни документы попадают в индекс, а другие - нет?

а почему одни страницы попадают в индекс.а другие нет!?

S

48

Sead

11 июня 2013, 07:06

#17

xarraw:
а почему одни страницы попадают в индекс.а другие нет!?

Потому что гуглу глубоко наплевать на robots.txt.

"Хотя Google не сканирует и не индексирует содержание страниц, заблокированных в файле robots.txt, URL, обнаруженные на других страницах в Интернете, по-прежнему могут добавляться в индекс" -справка гугла.

G

18

Gangsta

11 июня 2013, 07:31

#18

используйте noindex

X

70

xarraw

11 июня 2013, 07:54

#19

Sead:
Потому что гуглу глубоко наплевать на robots.txt.

"Хотя Google не сканирует и не индексирует содержание страниц, заблокированных в файле robots.txt, URL, обнаруженные на других страницах в Интернете, по-прежнему могут добавляться в индекс" -справка гугла.

хватит тупить! открой роботс и поставь метатеги😡 мудак!

AR

51

apple_rom

11 июня 2013, 08:02

#20

Строго по теме - 3 рабочих способа избавления от дублей и почему среди них нет robots.txt

Яндекс лучше или Google лучше? Яндекс - доказано Google. (http://noindex.by/meta/chto-luchshe-google-ili-yandeks#comment-5911)

Яндекс Вебмастер вынес товарные фиды в отдельный раздел

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта

Почему Гугл индексирует страницы закрытые в robots?