Почему гугл индексирует закрытые страницы

Z

42

zpearl

27 августа 2015, 10:30

#21

Коллеги, у меня ситуация интересней.

Гуглбот индексирует открытые посетителем страницы, которые, по идее, должен видеть только этот посетитель.

Пример. Клиент оплатил заказ и попал на спасибо-страницу, типа /thankyou?orderId=ab25a73b6a568b67ab37492659

Через некоторое время смотрю - на эту же страницу, со всеми параметрами, заходил гуглбот.

Страница /thankyou* закрыта в robots.txt

Предполагаю, что посетитель использует Chrome и Chrome гууглу этот url отдал, иначе у меня нет объяснений.

Кто нибудь в курсе откуда он их берет и как этому помешать?

Падение трафа без причин Кто чем загоняет сайты пару вопросов индексирование гугла

Д7

20

Дикообраз73

9 сентября 2015, 13:21

#22

Поставили <meta name="robots" content="noindex"> на все страницы, которые не должны быть в поиске. Открыли доступ для краулеров. Все правильно сделали?

Потом можно снова закрыть в роботсе, когда страницы выпадут из поиска? А то ведь насколько мы поняли ноиндекс учитывают не все роботы. Нам главное из гугла выпнуть дубли, ну и чтобы в яндексе они снова не появились.

Удаление из индекса Яши <meta name="robots" content="noindex"> Как закрыть страницы с

C

2

cheryi

24 сентября 2015, 13:51

#23

Можно удалить адреса (страницы, папки) в вебмастерсе, страницы с сортировочными параметрами обозначить, как "не влияют", поставить, где нужно redirect 301, 302, ну и закрыть в роботсе. Гугл рекомендует, еси дело касается целого каталога, удалить урл-адреса, а потом в робт.тхт закрыть. Я так сделал, дубли за 1-2 месяца убрались уже на 2/3. Проверьте ещё корректность вашего файлика роботс.тхт, потому что при сканировании гугл выдаёт: "Описание веб-страницы недоступно из-за ограничений в файле robots.txt. " - и всё!!!! Если он выдаёт содержимое страницы в результатах, значит не то, что-то с Вашим файликом либо гуг ещё не успел обновить результаты, закрывать сразу надо было, теперь ждите.

Обменяюсь статьями, ссылками, постами http://hottey.com.ua/ (http://hottey.com.ua/)

Удалить УРЛ из индекса Убрать из индекса 25К гугл не смотрит на

A

99

aldous

24 сентября 2015, 22:24

#24

Для несложных URL этого достаточно:

Читает и Яндекс и Google.

Сперва ссылки перестанут выдавать показы (будут находиться только по запросу site), потом со временем вообще исчезнут.

[Удален]

25 сентября 2015, 00:44

#25

aldous:
Удалённый url должен отдавать 404. Для Google этого достаточно.

недостаточно, он всё равно туда полезет, если раньше такая страница существовала или раньше была ссылка с данным url

и изменить это поведение невозможно, так поступают абсолютно все поисковики :)

C

2

cheryi

25 сентября 2015, 08:57

#26

Ну полезет, ну получит 404 и всё, это нормально, так и должно быть. Но тут сразу возникает рекомендация гугла: 1) удалите ссылки, которые были поставлены на несуществующую страницу 2) если есть страница с похожим (или дублирующим) содержанием (той, что удалена), то нужно делать на неё редирект.

Что делать? Есть ссылка, Бот гугла забегал по Точка входа на сайт

[Удален]

25 сентября 2015, 09:34

#27

cheryi:
Ну полезет, ну получит 404 и всё, это нормально, так и должно быть

это нормально 1раз или 2, но не на протяжении нескольких лет,

а рекомендации писать конечно проще, чем настроить работу своих ботов :(

A

99

aldous

25 сентября 2015, 19:03

#28

Вы не понимаете, что ссылка в индексе с показами и без показов - это совершенно разные вещи. Если вы что-то нашли через site, это ещё не значит, что оно есть для системы. Задача веб-мастера правильно передать сигнал, система поймёт, а визуально это может выглядеть как угодно. Например, в поиске можно найти источник 301 редиректа. Это нормально. Если занести в гск, можно увидеть, что на нём 0 показов.

301 редиректа нет, а Зеркала сайта в панели 404 ошибки

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах