роботс и пс

donty
На сайте с 17.01.2011
Offline
76
#31
Roman77:
у меня тоже игнорит User-Agent: *
уже 112 000 страниц, каждый день добавляет тыщь 5
а всего около 500 страниц,
щас прописал ему отдельного User-agent: Googlebot

Может и есть шанс, что персональное обращение на запрет увидит. На одном из сайтов давно стоит User-agent: Googlebot - в Вебмастере ругается, что запрещено, но хоть не индексирует все подряд.

Сделала и для других сайтов.

Тайны НЛО и бермудский треугольник ( http://tajny-nlo.ru/ )
Pavel Medvedev
На сайте с 27.01.2006
Offline
166
#32
burunduk:
sni, добавил 404 ответ на страницы, посмотрим уберёт ли

Cамый надежный способ)

Roman77:
щас прописал ему отдельного User-agent: Googlebot

Вряд ли поможет. Сохраненок у страниц нет, значит он их не индексирует.

Как сделать чтобы урлов вообще не было в выдаче(а они все вроде только в дополнительных результатах) - другой вопрос.

И надо ли это? Нахождение в выдаче запрещенных и неиндексируемых урлов влияет как-то на ранжирование?

Консультирую по SEO. Опыт c 2005: окна топ1,Ашан,Фишки,Спортс и др. Пишите в FB.
богоносец
На сайте с 30.01.2007
Offline
771
#33
sni:
Cамый надежный способ)

site:yandex.ru inurl:404

Без кеша http://yandex.ru/404.html

HTTP/1.1 404 Not Found

sni:
если закрыть страницу в robots, то гугл не сможет добраться до content="noindex"

Не знаю. Но в хелпе неоднозначность типа.

R7
На сайте с 30.04.2008
Offline
264
#34
sni:
И надо ли это? Нахождение в выдаче запрещенных и неиндексируемых урлов влияет как-то на ранжирование?

да,

после прописывания отдельно для гугла правил, рост дублей остановился и пошёл вниз.

совпадение?

Pavel Medvedev
На сайте с 27.01.2006
Offline
166
#35
богоносец:
site:yandex.ru inurl:404
Без кеша http://yandex.ru/404.html
HTTP/1.1 404 Not Found

А точно не отдавала раньше 200?

Вроде замечал странности давно, что у БДБД, яндекса и других сайтов почему-то делают страницы 404.html с кодом 200. Думал это новое веяние в SEO :)

[Удален]
#36

Здравствуйте. Такая же проблема. Более 100 ссылок, которые запрещены в роботс гугл индексирует и из-за этого низкий рейтинг у сайта. Пробовал удалять вручную из индекса, прошло 1-2 недели и опять повылазили... Как с этим бороться?

Такая запись будет корректна? User-agent: *, Googlebot

богоносец
На сайте с 30.01.2007
Offline
771
#37
sni:
А точно не отдавала раньше 200?

А как это проверить?

Ну вот сейчас отвечает 404, но на неё есть ссылка.

Можно будет посмотреть — останется в выдаче или нет?

sni:
почему-то делают страницы 404.html с кодом 200

Ну их в роботсе иногда закрывают.

301 в выдаче без кэша.

manZ:
User-agent: *, Googlebot

Давайте хелпы читать.

[Удален]
#38
богоносец:
Ну вот сейчас отвечает 404, но на неё есть ссылка.
Можно будет посмотреть — останется в выдаче или нет?

даже новые появляться будут

http://www.google.ru/search?q=site:www.allave.ru&num=100&hl=ru&newwindow=1&client=firefox&hs=1Sf&rls=org.mozilla:ru:official&prmd=imvns&filter=0&biw=1600&bih=691

богоносец
На сайте с 30.01.2007
Offline
771
#39
burunduk:
даже новые появляться будут

Т.е. попасть в выдачу (но не в кэш) может и то, чего нет на сайте. Но вот в августе 2010 ссылка на копию в выдаче была... но там сервак отвечал 200 по тому адресу с портом.

богоносец
На сайте с 30.01.2007
Offline
771
#40

Искал корпорация добра

Нашлось habrahabr.ru/search/?q=....

Кэш... по состоянию на 15 май 2012

User-agent: Google

Crawl-delay: 2

Disallow: /search/

У роботса Last-Modified: Tue, 13 Mar 2012

Кэш роботса от 28 апр 2012

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий