- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Подскажите пожалуйста, на моем сайте огромное кол-во проиндексированных документов .doc
Насколько я понимаю, они мешают.
Прописал в robots.txt
User-agent: *
Disallow: /*.doc
Попытался удалить в яндексе при помощи формы http://webmaster.yandex.ru/delurl.xml
но ответ
Документ www.moy-sait.ru/Latviisk-vizy.doc не может быть удален из базы Яндекса, так как он возвращает код, отличный от 404, и не запрещен в /robots.txt. Нет оснований для удаления.
Что я делаю не так и как мне избавится от этих страниц?
acid777, поместите все .doc файлы в одну директорию и запретите её к индексации в robots.txt.
Disallow: /*.doc
Это неправильная конструкция. Если все файлы в одном каталоге - закройте каталог. Иначе - придется закрывать каждый файл. В роботсе нельзя файлы по маске закрывать.
Попробуйте поисковикам отдать заголовок не ворд-документа, например 'Content-Type: application/octet-stream'
а как это сделать?
acid777, вот этого будет вполне достаточно:
User-agent: *
Disallow: /catalog/
как правильно сказали JonnyB и Цахес: закройте каталог.
Алгоритм такой:
htaccess: вместо 111.doc открывать /fix.php?file=111.doc
fix.php:
Нужно добавить проверку на то, что в $_GET['file'] - путь к док файлу, а не напримр к index.php (рег выражения плохо знаю)
Можно закрыть еще посредством mod_rewrite
.htaccess
RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^Yandex [NC,OR]
RewriteCond %{HTTP_USER_AGENT} Slurp [NC,OR]
RewriteCond %{HTTP_USER_AGENT} ^StackRambler [NC,OR]
RewriteCond %{HTTP_USER_AGENT} ^Aport [NC,OR]
RewriteCond %{HTTP_USER_AGENT} msnbot [NC]
RewriteRule .*\.doc$ - [F,L]
Можно закрыть еще посредством mod_rewrite
.htaccess
И что поисковики их индексировать не будут?
Для них будет 403 - Forbidden. Доступ к файлам .doc запрещен.
Для всех остальных нет.
RewriteCond %{HTTP_USER_AGENT} Slurp [NC,OR]
Это google.ru
и google.com и все остальные google
Я правильно понимаю?
acid777, это Yahoo