Помогите закрыть pdf от гугла

12
Unlock
На сайте с 01.08.2004
Offline
757
2972

Гугл, зараза, стал игнорировать robots.txt и проиндексировал pdf файлы. Подскажите пожалуйста как оформить ссылку так, чтобы люди могли без проблем смотреть статьи, а боты гугла обламывались. Я догадываюсь что это делается через javascript, но как конкретно?

Есть желание, - тысяча способов; нет желания, - тысяча поводов! /Петр-I/.
C
На сайте с 19.09.2001
Offline
120
#1
Гугл, зараза, стал игнорировать robots.txt и проиндексировал pdf файлы.

Можете привести здесь содержимое файла, инструкции которого проигнорировал Гугль?

А ссылку можно сделать например так:

<a href="#" onclick="document.location='/filepath/file.pdf'; return false">Test</a>

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
Nikolai Popkov
На сайте с 07.06.2001
Offline
210
#2

поместите все такие файлы в отдельную папку /pdf/ и запретите её индексацию

партнерские программы (http://www.ebanners.ru/viewforum.php?f=7), словарь термины SEO (http://www.ebanners.ru/viewtopic.php?t=548) Форум маркетинг (http://www.reclama.su/) Reclama.Su, обмен ссылками (http://www.ebanners.ru/viewforum.php?f=13), Reklama.SU: контекстная реклама (http://www.reklama.su/) по цене Яндекса+продвижение за результат
Unlock
На сайте с 01.08.2004
Offline
757
#3

Cherny,

User-agent: *

Disallow: /articles/

Nikolai Popkov,

Ну совсем за дурака не надо меня держать ;) Pdf файлы лежат в папке articles. Файл robots.txt приведен выше.

Nikolai Popkov
На сайте с 07.06.2001
Offline
210
#4

Unlock,

1. Это был общий совет, ваш сайт я не смотрел

2. C чего вы взяли, что Google проиндексировал файлы? Они есть в кэше? Есть сниппеты? Google может просто показывать адрес файла, но не индексировать его.

AiK
На сайте с 27.10.2000
Offline
257
AiK
#5

Для гугля кстати и так можно:


User-agent: Googlebot
Disallow: *.pdf
Nikolai Popkov
На сайте с 07.06.2001
Offline
210
#6

Запись должна начинаться с одной или нескольких строк User-Agentпопробуйте сделать A - большой

О каком сайте идет речь?

Unlock
На сайте с 01.08.2004
Offline
757
#7

Nikolai Popkov,

В кеше нет, сниппетов нет. Я не знал и не сообразил что гугл может в индекс выкидывать файлы и при этом не индексировать. Т.е. тогда можно не обращать внимания на такую ситуацию?

Unlock
На сайте с 01.08.2004
Offline
757
#8

AiK,

Т.е. можно в существующий файл robots.txt

User-agent: *

Disallow: /articles/

Дописать:

User-agent: Googlebot

Disallow: *.pdf

Nikolai Popkov, попробывать сделать А большой конечно можно, но только как то уж это странно. Название директории то начинается с а маленькой.

AiK
На сайте с 27.10.2000
Offline
257
AiK
#9

Если цель закрыть только pdf файлы - то да.

Если закрывается ещё что-то, например /cgi-bin/, то всё нужно продублировать в секции для Гугля, т.к. при наличии персональной секции бот игнорирует общие директивы.

AiK
На сайте с 27.10.2000
Offline
257
AiK
#10

Название директории то начинается с а маленькой.

имелось ввиду A в user-agent. Но это совет "на удачу" - по стандарту The field name is case insensitive.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий