- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Маркетинг для шоколадной фабрики. На 34% выше средний чек
Через устранение узких мест
Оксана Мамчуева
В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Речь идет о файле robots.txt и как правильно запретить индексировать определенные ссылки в струкуре сайта. Возможно я неравильно пишу, но догнать никак не могу, везде пишут об этом, но видно мне это тяжело дается )
Задача в следующем: есть сайт и его структура.
Есть «левые ссылки» то есть дубли страниц, в панели вебмастер они видны. Мне надо сделать так, чтобы эти дубли не учитывали поисковой системой Я.
По структуре, дубли начинаются с:
Выше приведена структура, которую надо исключить из поиска, то есть указать поисковику что не надо индексировать.
Подскажите пожалуйста, как правильно прописать в файле robots.txt для данной структуре.
Так в чём проблема? Disallow: /component и иже с ними. А ещё есть тэг nofollow
Так в чём проблема?
Эту тему будут читать много людей, чем подробнее, тем меньше людей будут сталкиваться с возникшимися трудностями.
То есть пишем следующее:
Disallow: /component
Правильно?
А стоит ли указывать Disallow: /content и так далее по структуре. Ведь content исходит из component и я думаю не стоит так прописывать. Или я чего не понял?
Далее, можно прописать только: Disallow: /index.php? и все что идет после index.php? по структуре, думаю прописывать не надо?
А будут ли без проблем индексироваться sef ссылки, то есть оптимизированные под ПС.
Так как правильно сделать?
P.s. Один полный, развернутый ответ, отбросит множество вопросов.
При чем тут nofollow? Он для Я нужен?
Так как правильно сделать?
Если я правильно понял структуру Вашего сайта, то роботс.тхт для Яндекса должен выглядеть примерно так:
User-agent: Yandex
Disallow: /component/
Disallow: /content/
Disallow: /jcomments/
Disallow: /mailto/
Disallow: /rafcloud/
Disallow: /search/
Disallow: /index.php?option*
Disallow: /index.php?view*
Host: www.site.ru
Если в чем-то сомневаетесь (например, будут ли открыты нужные страницы для индексации), то загружаете этот роботс в корень сайта и идете в панель вебмастера. Там есть функционал для проверки разрешения индексации конкретных страниц.
При чем тут nofollow? Он для Я нужен?
Да, Яндекс тоже научился понимать этот тег
Если в чем-то сомневаетесь (например, будут ли открыты нужные страницы для индексации), то загружаете этот роботс в корень сайта и идете в панель вебмастера. Там есть функционал для проверки разрешения индексации конкретных страниц.
Вот тут смотрю на два ответа и вижу два расхождения и конкретно, прям указывая конкретно на правильный ответ я не вижу. Извините конечно, но я вот не вижу.
Первый ответ от Chaotic, указывал что вот так будет правильно: Disallow: /component
Второй ответ от Hristofor, указывал что вот так будет правильно: Disallow: /component/
Различие кто-нибудь видет? Я прекрасно вижу — это слэш.
Риторический вопрос, так как правильно запретить индексировать? Чей ответ правильный?
Прям как в школе, при доказательстве теоремы.
У себя такие делаю роботсы для Джумла, без форума, социальной сети и комментариев. Обязательно включен ЧПУ. Все отлично индексируется, все страницы нужные в индексе. Дублей практически нет.
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/
Disallow: /component/
Disallow: /index.php
essey добавил 12.10.2010 в 00:10
Где стоит слеш там закрывается директория, там где беза слеша там закрывается просто страница начинающаяся например с index.php или search.php, send.php
index.php или send.php к примеру, это не директории, это страницы с командами и данными. Надеюсь понятно выразился.
самый правильный вариант
User agent: *
Disallow: /
Host: site.ru
и вообще не париться, фильтры, апы, недоапы и т.д.
зы: сколько тем было, сколько есть инфы в сети.. а поиском так и не научились пользоваться.. обидно однако.
Первый ответ от Chaotic, указывал что вот так будет правильно: Disallow: /component
Второй ответ от Hristofor, указывал что вот так будет правильно: Disallow: /component/
Различие кто-нибудь видет? Я прекрасно вижу — это слэш.
Риторический вопрос, так как правильно запретить индексировать? Чей ответ правильный?
Оба правильные. Первый запрещает, как файл /component.html, так и деррикторию, а второй только деррикторию.
самый правильный вариант
User agent: *
Disallow: /
Host: site.ru
Совсем не правильный вариант, кроме яндекса Host никому не нужен, поэтому правильно будет:
User agent: Yandex
Disallow: /
Host: site.ru
User agent: *
Disallow: /
ARepik, жгешь, с "Disallow: /" сайт вообще никому не нужен будет.
И кстати в анализаторе Яндекса такой блок обрабатывается нормально.
Научитесь сами составлять robots.txt, а потом советуйте.
_han_, у тебя кстати тоже ошибочка есть. :)
для одаренных
User agent: *
Disallow: /
Host: site.ru
и вообще не париться, фильтры, апы, недоапы и т.д.
да 10 смайликов нужно было поставить?