Настройте правильный robots. Txt для моего сайта - Вопросы новичков в SEO

Все вопросы по robots.txt - 2

KeicH2O · 2020-07-28T15:09:23.0000000Z

Конеш я не спорю, что нужно читать рекомендации яндекса и гугла, что нужно читать и разбираться. Я не спорю может с тем, что вопрос задал не корректно, если бы разбирался во всем этом и вопрос был бы поставлен как нужно. Дело в том что к примеру я знаю какие разделы или категории нужно закрыть на сайте, но я не знаю всех системных вещей. К примеру раньше закрывали wp-content, теперь рекомендуют этого не делать. Я не совсем понимаю к примеру, какие скрипты для загрузки нужны поисковикам с системных папок cgi-bin. Я хочу чтобы в ПИ небыло мусора как feed, который есть в скрытых результатах гугла, но нету в яше. Хочу чтобы ПИ правильно подгружали скрипты и картинки. Не знаю правильно ли щас изложил мысли). Может вообще уже ничего закрывать ненужно от роботов, может гуглойд и яша научились не парсить в индекс всякий мусор ------------------------- Примечание модератора Предыдущая тема: /ru/forum/828288

142

nicha

4 июля 2019, 13:38

#311

Задача запретить гуглу индексировать сайт, но разрешить вход адсенс боту.

Сначала я запретил всех ботов

User-agent: *

Disallow: /

Индекса нет, но при модерации адсенсом сайта, отклон: "сайт недоступен", т.к. бота адсенса отфутболил.

Погуглил и сделал так:

User-agent: Googlebot

Disallow: /

User-agent: Mediapartners-Google

Disallow:

Индекс есть, модерацию проходит.

Подозреваю, что индексирует сайт бот с другим именем, но тут других не указано.

Зашел в логи хостинга, там только айпишники, юзерагентов нет.

Как запретить всех ботам , кроме Mediapartners, так прокатит?

User-agent: Mediapartners-Google

Disallow:

User-agent: *

Disallow: /

Как правильно настроить роботс, под мою задачу?

Google AdSense - Вопросы Не показывается реклама на Какая директива в роботс.тхт

84

Greatbolt

12 июля 2019, 01:06

#312

Тут почитайте про allow директиву для robots, очень все доступно

Отличные тексты для Бурж сайтов. Вебархив. Ищу сам, за качество отвечаю. 12 руб. / 1к текста. Оплата после проверки текстов. Отдаю в одни руки. Уникальность 90-100% etxt/text.ru/content-watch.

VO

8

Vitaliy_Omelch

30 июля 2019, 12:40

#313

Вот мой короткий robots.txt

User-agent: *

Allow: /

Disallow: /admin/

Sitemap: https://suntown-ukra...com/sitemap.xml

часто видел что в файле robots.txt указывают очень много правил, стоит ли мне указывать их больше?

как я понимаю поисковые роботы индексируют всё что есть на сервере в сайте, если у меня в связи с тем, что я не кодер, нету доступа к серверной части сайта, то получается я и не смогу указать ничего более подробно в robots.txt? Или есть какие-то стандартные правила составления всех robots.txt?

Изменение User-Agent робота РСЯ Новые стандарты для директивы Составление файла robots.txt

228

Lazy Badger

30 июля 2019, 13:05

#314

1. "Правильно заданный вопрос - половина ответа"

2. Правильно (полно и понятно) написанный заголовок - +100% к шансу того, что сообщение будет открыто и хотя бы прочитано

3. "Если ничего не помогает - прочтите наконец документацию"

По всему этому ответ на вопрос "Составление правильного robots.txt для моего сайта" будет скорее всего таким:

robots.txt включает в себя страницы и маски страниц сайта, которые хозяин-разработчик-автор сайта считает ненужными в индексе поисковых систем по разным причинам, по своим принципам, учитывая что

Без robots.txt та информация, которая должна быть скрыта от посторонних глаз, может попасть в выдачу, а из-за этого пострадаете и вы, и сайт.

и на зная сайта, сказать, полный или неполный набор правил, могут только всезнающие "иксперды", но у них сейчас, к сожалению, каникулы

Если серьезно, то

* "Allow /" является бесполезной в контексте директивой, потому как "разрешено все, что явно не запрещено"

* проверить, как сайт будет доступен спайдерам, можно при помощи любого краулера, который понимает и парсит robots.txt - просто просканировать сайт и посмотреть, нет ли чего лишнего в выдаче (что не гаранирует, что это "лишнее" не появится потом в выдаче при помощи внешних ссылок) или же нагуглить "рекомендованный robots.txt для <CMS> <Version>" и думать над результатами поисков

Производство жести методом непрерывного отжига

Новые стандарты для директивы JavaScript и SEO: сканирует Wix сайты выпали из

DM

52

Dark Master

14 августа 2019, 11:24

#315

Здравствуйте. Интересует такой вопрос: если в robots.txt указать запрет индексации определенного раздела, например:

Disallow: /category/

исчезнут ли из выдачи страницы данного раздела, вроде /category/page.html, которые до этого уже проиндексировались?

Спасибо.

S

469

Sitealert

14 августа 2019, 12:13

#316

Dark Master:
если в robots.txt указать запрет индексации

Вы не можете запретить индексацию в robots.txt. Вы можете запретить роботу (рекомендательно, естественно) посещать указанный в директиве ресурс.

1

Отпилю лишнее, прикручу нужное, выправлю кривое. Вытравлю вредителей.

V8

57

Vit86

14 августа 2019, 12:28

#317

Даже полностью запретить индексацию сайта, он не выпадет из поиска.

Внешние ссылки на эти страницы с категорией есть?

1

Купля-продажа сайтов, блогов, каналов( https://siteizi.ru/ )

DM

52

Dark Master

15 августа 2019, 16:17

#318

Vit86:
Даже полностью запретить индексацию сайта, он не выпадет из поиска.
Внешние ссылки на эти страницы с категорией есть?

Возможно на некоторые страницы категории ссылки имеются, но мне нужно было удалить из выдачи Яндекса конкретно саму страницу раздела - site.ru/category/, на которой частично дублируется контент внутренних страниц раздела. Собственно запрос на удаление уже сделал в Вебмастере, вроде осталось дождаться апдейта.

Интересует еще один вопрос: как правильно запретить роботу ходить по урлам, содержащим определенные параметры или символы, в частности символ "?" (знак вопроса).

Как правильно сделать:

Disallow: /*?* , Disallow: /*? , Disallow: *?* или Disallow: *? ?

Индексация Яндексом Фатальная ошибка индексирования яндекс Запрет индексации некоторых страниц

[Удален]

16 августа 2019, 10:58

#319

Второй, что ж так прямые инструкции неясны...

1

E

134

ezon

4 сентября 2019, 05:30

#320

Что-то тип того, для настройки гипотетического сайта.

User-agent: *

Disallow: /wp-login.php

Disallow: /wp-register.php

Disallow: /feed/

Disallow: /cgi-bin

Disallow: /wp-admin

Disallow: /wp-includes

Disallow: /wp-content/plugins

Disallow: /wp-content/cache

Disallow: /wp-content/themes

Disallow: /trackback

Disallow: */comments

Disallow: /category/*/*

Disallow: */trackback

Disallow: */*/trackback

Disallow: */*/feed/*/

Disallow: */feed

Disallow: /*?*

Disallow: /?s=

Allow: *?replytocom

User-agent: Yandex

Disallow: /wp-login.php

Disallow: /wp-register.php

Disallow: /feed/

Disallow: /cgi-bin

Disallow: /wp-admin

Disallow: /wp-includes

Disallow: /wp-content/plugins

Disallow: /wp-content/cache

Disallow: /wp-content/themes

Disallow: /trackback

Disallow: */comments

Disallow: /category/*/*

Disallow: */trackback

Disallow: */*/trackback

Disallow: */*/feed/*/

Disallow: */feed

Disallow: /*?*

Disallow: /?s=

Allow: *?replytocom

Host: ваш-сайт.ru

Sitemap:

Кластеризатор ключевых слов (https://seoquick.com.ua/keyword-grouping/) - Группировка 20,000 слов за 1 минуту. Калькулятор качества Title (https://seoquick.com.ua/calculator-title/) - Калькулятор качества заголовков Генератор объявлений Google Ads (https://seoquick.com.ua/adwords-generator/) - Генерируй сотни объявлений

Изменение User-Agent робота РСЯ Составление файла robots.txt О чем нужно помнить

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах

Маркетинг для шоколадной фабрики. На 34% выше средний чек

Все вопросы по robots.txt - 2