- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Здравствуйте. Хочу задать вопрос по поводу скрытия от индексации части сайта в файле /robots.txt
На моем сайте есть форум. Он существует в обычной, и текстовой версии. На сколько я понимаю, поисковики индексируют оба варианта и получается дубликат контента. Можно ли в файле /robots.txt скрыть текстовую версию форума?
Если можно я приведу пример ссылок на форум, чтобы было понятнее .
http://videochaty.ru/?inc=forum&forum=7&topic=16851 обычный форум
http://videochaty.ru/?inc=forum&archive=html&forum=7&topic=16851 текстовая версия.
Разница в одном слове.
если в файле /robots.txt индексацию запретить нельзя, то может быть существуют какие то альтернативные пути решения? Или может быть в подобном дублировании нет ничего страшного и я зря морочу себе голову?
Буду признателен за любую помощь.
P.S.
я на этом форуме недавно и не знаю можно ли оставлять ссылки в сообщении. Если нельзя , то прошу модераторов просто удалить ссылки, а вопрос оставить. Мне бы хотелось услышать совет людей, которые давно занимаются оптимизацией сайтов.
Так для начала скажу, не приводя вашу цитату, разница не в слове а в названии переменной урла. Читать "arch=****"Для того чтобы исключить из индекса все страницы с такой пременной необходимо обратится к хелпам яндекса относительно robots.txt, где можно найти ответ на данный вопрос.
Обратился. Но к сожалению не нашел я где описываются эти переменные. Понял только, как исключить из индексирования полностью определенную папку. Вас бы не затруднило на конкретном примере, приведенном выше написать одно слово. Что нужно написать после
Disallow: Для того чтобы исключить из индексации все странички с переменной &archive=html 😕
Я чего-то не понимаю? Вот так не подойдет что-ли?
Disallow: /*archive
И проверить не забудьте.
Вот честно скажу ответил по памяти и когдато видел в хелпаз про переменные и сейсас специально сморел и ненашел, но
Я чего-то не понимаю? Вот так не подойдет что-ли?
Disallow: /*archive
И проверить не забудьте.
принципе согласен только можно почеловечиски(понятнее) написать
User-agent: *
Disallow: /*archive=*
Проверил. Насколько я понимаю в этой проверке, ошибки нет. Но остался вопрос при таком способе написания Disallow: /*archive Поисковики исключат из индексации текстовую версию форума? И не скажется ли это негативно на остальном контенте? Крайне не хотелось бы прописывать наугад.
Так как лучше написать?
Disallow: /*archive=*
или
Disallow: /*archive
Проверил. Насколько я понимаю в этой проверке, ошибки нет. Но остался вопрос при таком способе написания Disallow: /*archive Поисковики исключат из индексации текстовую версию форума? И не скажется ли это негативно на остальном контенте? Крайне не хотелось бы прописывать наугад.
Они исключат все страницы, в адресе которых содержится "archive".
Вы уверены, что читали хелп по роботсу?
Читал. Но в вашем коментарии был вопрос и у меня появились сомнения в правильности написания строчки. Большое спасибо, что откликнулись. Значит буду прописывать Disallow: /*archive=*
Если я что то не так понял. не сочтите за труд меня поправить.
Читал. Но в вашем коментарии был вопрос и у меня появились сомнения в правильности написания строчки.
Вопрос был, потому что я сомневался, что человек, прочитавший хелп не справился с составлением правила в роботсе. Читайте еще и внимательнее - мой Вам совет.
принципе согласен только можно почеловечиски(понятнее) написать
User-agent: *
Disallow: /*archive=*
По-человечески, никакой разницы. "=" при указанной в первом посте структуре адресов погоды не делает, а "*" в конце всегда подразумевается.
Ну а в принципе, мне пофик - согласны Вы или нет :)
погоды не делает, а "*" в конце всегда подразумевается.
Ну а в принципе, мне пофик - согласны Вы или нет :)
Да тут всем, по большому счету всё пофиг, а если у вас чтото личное то - ну ладно... я просто предложил тотже вариант только более понятный человеку с первого взгляда, впрочем на хлеб и секс товарищей нет :)
А если ТС хочет еще то могу предложить еще вариант решения вопроса
в начало index.php добавляем такую штуку
if(!empty($_GET["archive"])){
header("HTTP/1.1 404 Not Found", true, 404);
}
?>