- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Есть партнерский сайт. Там в роботе, по умолчанию, записано следующее:
User-agent: *
Disallow: /files/
Disallow: /profile.php?mode=sendpassword
Disallow: /russian/
Disallow: /english/
Disallow: /static/i/
Disallow: /cache/
Disallow: /texts/
Disallow: /functions/
Disallow: /vote/
Disallow: /complain.php
Я не могу изменить эти записи, а только добавить ниже свои.
Мне нужно запретить все страницы к индексации, кроме главной и кроме страниц которые имеют урлы вида: http://site.ru/abc_nazvanie-stranitsi.html
то есть abc_ присутствует везде.
Если я в роботе допишу ниже, следующее:
User-agent: *
Disallow: /files/
Disallow: /profile.php?mode=sendpassword
Disallow: /russian/
Disallow: /english/
Disallow: /static/i/
Disallow: /cache/
Disallow: /texts/
Disallow: /functions/
Disallow: /vote/
Disallow: /complain.php
Allow: site.ru
Allow: /abc_*
Disallow: /
Это будет правильно?
Сверху идущие Disallow мешать не будут?
* звездочка по инструкции означает любые символы, в том числе и отсутствие их, она применима в конструкции http://site.ru/abc_nazvanie-stranitsi.html, просто вот так http://site.ru/abc_* или она работает только для подкаталогов разделенным слэшем / ?
PS Блин, заказал контент, и только сейчас этот робот увидел. Там много однотипных страниц, которые сразу вывалятся из индекса и весь сайт потянут. Нужно закрыть все, кроме главной и статей - http://site.ru/abc_nazvanie-stranitsi.html
User-agent: *
Disallow: /files/
Disallow: /profile.php?mode=sendpassword
Disallow: /russian/
Disallow: /english/
Disallow: /static/i/
Disallow: /cache/
Disallow: /texts/
Disallow: /functions/
Disallow: /vote/
Disallow: /complain.php
Allow: /abc_
Disallow: /
Чтобы разрешить доступ робота к некоторым частям сайта или сайту целиком, используйте директиву 'Allow'. Примеры:
User-agent: Yandex
Allow: /cgi-bin
Disallow: /
# запрещает скачивать все, кроме страниц
# начинающихся с '/cgi-bin'
Запрещает скачивать ВСЁ, кроме страниц начинающихся с '/cgi-bin'
ТО есть и главную? вот тут непоняточки... Или главная по умолчанию главная?
Langly, учтите, что если Вы добавите
User-agent: Yandex
то все что было в robots.txt для
User-agent: *
Яндекс будет игнорировать (то же касается и для гугла при добавлении его User-agent)
чтобы этого не произошло, нужно будет после "User-agent: Yandex" продублировать все строки,написанные для "User-agent: *"
А вообще заходите на
http://webmaster.yandex.ru/robots.xml
и вставив содержимое robots.txt добавляете URL которые хотите проверить (будут ли они индексироваться) и проверяйте.
И будет у Вас информация из первых рук, от Яндекса.
Allow: /cgi-bin
Disallow: /
# запрещает скачивать все, кроме страниц
# начинающихся с '/cgi-bin'
Запрещает скачивать ВСЁ, кроме страниц начинающихся с '/cgi-bin'
ТО есть и главную?
То есть да - Disallow: / -запрет всего
Чтобы разрешать и главную
Allow: /$
Естественно добавить перед всеобще закрывающим disallow. Бот читает инструкции построчно, и на первой совпавшей останавливается.