- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
А для проиндексированых robots.txt он еще и тайтлы придумывает
http://www.google.com/search?q=inurl:robots.txt
http://www.google.com/search?q=inurl:sitemap.xml
По какому принципу эти ИО тайтлов?
сайт отдает 404 но гуглу пофиг он все это добро сует в индекс
Каким же это образом, что в индекс-то попадает?
Как-то попадает.
Делаем выдуманный запрос site:404.yandex.ru
Но почему-то Народовой страницы 404 в индексе Гугля нету!
У меня точно такой же ахтунг случился.
Сайту пол года, нормально индексировался, все лишнее было закрыто в robots.txt.
А сегодня я обнаружил, что страниц в индексе стало в 2 раза больше благодаря URL-ам вида http://site.ru/articles/blablabla/feed.
В гугл вебмастере показывается что ссылки запрещены к индексации.
Мистика короче.
О, у меня такая же фигня, на сайте про автомобили. В robots.txt все нормально, проверил в "вебмастере" и яндекса, и гугла. Попробую еще тегами в шаблоне закрыть.
Google кладет на robots.txt, 404, метатеги, редиректы и отсутствие ссылок, упорно отображая страницы в списке проиндексированных, а удаление через вебмастер всего лишь скрывает страницы на 90 дней, продолжая хранить их в индексе
А для проиндексированых robots.txt он еще и тайтлы придумывает: http://www.google.ru/search?q=inurl:%22com/robots.txt%22
В общем придерживаюсь того же мнения.
Тем более, цикл в 90 дней - это очень похоже.
Тайтлы порадовали!!!
terrell, вот свежие рекоммендации самого Google.
Цитируйте полностью
То есть в индексе будет храниться информация о странице, доступная на внешнем сайте. А не содержимое страницы, закрытое robots.txt. По крайней мере, так утверждают в Гугл. Может практика и расходится с этими утверждениями, но в Гугл не заявляют "нам пофиг на robots".
Цитируйте полностью
То есть в индексе будет храниться информация о странице, доступная на внешнем сайте. А не содержимое страницы, закрытое robots.txt. По крайней мере, так утверждают в Гугл. Может практика и расходится с этими утверждениями, но в Гугл не заявляют "нам пофиг на robots".
Верно, кэш страницы не отдаётся..
В результатах поиска - только ссылка на закрытую в роботс страницу.
Закрывать в роботс "частично" содержимое страницы? Как?
Или пусть сам определяет, что "частично" индексить, а что целиком?
"Можем" и "возможно" - как-то не утвердительно..
Закрывать в роботс "частично" содержимое страницы? Как?
Или пусть сам определяет, что "частично" индексить, а что целиком?
robots работает на уровне URL, то есть целых страниц. Ни о каких правилах частичной индексации с помощью robots.txt речи идти не может.
Также как нельзя с помощью robots.txt запретить собирать данные о странице, опубликованные на других сайтах (URL и анкор, как в рекомендация Гугл).
Ни о каких правилах частичной индексации с помощью robots.txt речи идти не может.
Вот только правила пишутся не утвердительно и двузначно.
..."Можем" и "возможно, и другая общедоступная информация"...
Вместо сторонних ссылок гугл может использовать бар и т.п.
Индексируется не доступный для робота материал, а просто общедоступный.
Спасибо, разобрался уже.