webinfo

Рейтинг
306
Регистрация
22.01.2021
Vladimir #:

для разбавления контента?

Да, чисто для разнообразия. Чтобы человек, зайдя на городской сайт, мог увидеть  "выжимку" местных новостей.

Vladimir #:
больше нечем

Ноуиндекс же. Разместить в хэдере при условии наличия гет-параметра - и всё, вопрос решён.

media-of-future #:
Остановились на варианте проект с простейшей самописной  панелью администратора (добавить/редактировать/удалить новость - и все) и настройкой RSS. Дизайн решили упросить по максимуму - только размещение логотипа и использование определенного шрифта. Никакого фонового оформления, кнопок, картинок и пр. - не предполагается.

На самом деле, CMS - это не только панель администратора. Да и в панели администратора понадобится ещё кое-что, кроме редактирования новости и настройки CSS.

У вас вообще есть опыт написания самописных систем?

Алеандр #:

Ну, почитайте документацию и вы увидите, что роботс - тоже самое, что ноиндекс в теле страницы.

Твою же душу, как всё запущено... Ну почитайте:
https://developers.google.com/search/docs/crawling-indexing/robots/intro

Файл robots.txt не предназначен для того, чтобы запрещать показ ваших материалов в результатах поиска Google. Если вы не хотите, чтобы какие-либо страницы с вашего сайта были представлены в Google, добавьте на них директиву noindex

Алеандр #:
Еще раз, роботс не запрещает получение страницы, не запрещает сканирование, не запрещает ее анализ. Он запрещает индексирование страницы

Ужосс... Почитайте ещё:
https://support.google.com/webmasters/answer/12818275?hl=ru

Файл robots.txt предназначен только для того, чтобы запретить сканирование тех или иных страниц. Если вам нужно предотвратить появление страницы или изображения в результатах поиска, используйте другие средства.

Алеандр #:

Какое отношение имеет переход на страницу к запрету ее индексации? ) Роботс запрещает индексацию, а не переход на эту страницу. Ровно так же, как и тег ноиндекс на самой странице и, вот неожиданность, что бы его ПС увидела - ей надо сначала получить страницу )

Вы о чём вообще? Если робот перешёл на страницу, то он может её проиндексировать, для Вас это большая новость? И если, перейдя на страницу, он увидит там noindex, то не станет её индексировать - с этим тоже будете спорить? Ну давайте продолжим эту бесполезную дискуссию, в которой Вы опираетесь исключительно на свой личный опыт, а не на документы поисковых систем. Поэтому и возникают такие фразы:

Алеандр #:
вот неожиданность
cyberbonus #:

А вы сами читаете кого-то по rss? 😊

При чём тут чтение RSS? RSS нужны для размещения ссылок на других ресурсах. Я, например, кое-где разместил новостные ленты. Не свои, а чужие на своём сайте.

Алеандр #:
я предпочту опираться на свой многолетний опыт, показывающий, что правила роботса игнорируются только тогда, когда он неверно составлен

Нет, не только. Когда висит ссылка на стороннем сайте, то поисковик даже не смотрит в роботс, а сразу переходит по ссылке. Просто конкретно в вашем случае таких ссылок, по-видимому, не было, но это не означает, что такая же ситуация у всех.

AutoBlogger #:
Задержку делают, чтобы люди с рекламой ознакомиться успели

Когда появляется надпись типа "подождите пять секунд", люди не с рекламой знакомятся, а тупо смотрят на эту надпись.

Дофига всего понаписали, а про каноникал не забыли? Всё поэффективнее роботса будет. А ещё noindex есть.

И я тут немного подумал - скорее всего, по указанной ссылке ничего нет, и кдаудфлэр просто обрабатывает подобные запросы таким образом, что подсовывает файл со своего сервера. В таком случае бесполезно что-то предпринимать через апач или энджинкс, и вопрос можно решить только через сам клаудфлэр.

Однако основной вопрос остаётся: с какого перепуга Гугл всё это решил включать в индекс? Но это вопрос для другого раздела, этот топик мы уже итак зафлудили обсуждением нерелевантного вопроса.

Всего: 7661