- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
что нужно написать в robots.txt чтобы паук не заходил на стр.
http://river.rkoop.ru/teplohod.htm
?
User-agent: *
Disallow: /teplohod.htm
User-agent: *
Disallow: /teplohod.htm
спасибо
Продолжаю тему...
Один мой приятель просил помочь... Робот скушал кривые урлы вида http://www.сайт.ru/123/www.сайт.ru (ошибка в движке). Причем параметр 123 всегда разный (доска объявлений - номер объявления).
Соответственно, что нужно написать в robots.txt, чтобы робот не бегал по этим кривым урлам.
Неужели придется так?:(
User-agent: *
Disallow: /111/www.сайт.ru
Disallow: /222/www.сайт.ru
Или сработает так?
User-agent: *
Disallow: /www.сайт.ru
Но Яндекс при попытке удалить страницу через removeurl ругается и говорит, что эта страница не запрещена в robots.txt.
Если проблема только в Яндексе, то попробуйте написать так:
User-agent: Yandex
Disallow: /*/www.сайт.ru
А потом удалить страницы с помощью формы. Если не сложно, сообщите результаты здесь или в личке.
Если проблема только в Яндексе, то попробуйте написать так:
User-agent: Yandex
Disallow: /*/www.сайт.ru
А потом удалить страницы с помощью формы. Если не сложно, сообщите результаты здесь или в личке.
Хм... не работает...:(
Еще есть предложения?
А тем же движком нельзя сгенерить robots.txt автоматом, чтобы руками не писать?
Можно еще с помощью mod_rewrite выдавать код, отличный от 200, на все такие страницы.
Реанимирую топик. Остались вопросы.
Продвигаю интернет-магазин Plazasport.ru.
Робот прошелся по ссылками "Добавить в корзину".
Теперь в базе поисковиков страницы вида...
www.магазин.ru/catalog/номер_раздела/номер_товара/?buy=номер_товара
Понятно, что нужно спрятать от роботов ссылку "Добавить в корзину".
Но как мне с помощью robots.txt вычистить мусор из базы поисковиков?
На Холодильнике.ру я видел нужные конструкции robots.txt. Работают ли они?
С помощью мета-тэгов можно запретить индексацию.
А как с помощью mod_rewrite запретить к индексации определенные страницы?