Антоний Казанский

Антоний Казанский
Рейтинг
796
Регистрация
12.04.2007
Должность
Частный интернет-маркетолог и SEO специалист
Интересы
Интернет-маркетинг, SEO, интернет реклама
Подробности на сайте https://akazansky.ru
Алеандр #:
Нет смысла за это воевать,

Воевать конечно нет смысла :) есть смысл прислушиваться к коллегам и учитывать их полезный опыт :)


Алеандр #:
достаточно дополнительно в роботс поставить запрет на /*?* и все вопросы будут решены. Для ПС этот вариант будет запрещен к индексированию и они отлично с этим справляются

Увы, недостаточно.

Как практика показывает Гугл инструкции robots может запросто игнорировать, и Яндекс увы тоже варианты /? и /*?* может игнорировать.


Алеандр #:
а по факту, за счет правила htaccess, при реальных значениях, будет редирект или 404, как настроить.

Ну, соб-но, мы это и обсуждаем :)


Алеандр #:
Тогда пустое значение даже не придется вылавливать, оно будет запрещено к индексации, а сам параметр будет не страшен в виде вхождения, поскольку он, опять же, совершенно пустой.

Увы неоднократно сталкивался с ситуаций, когда Яндекс индексировал вариант site.ru/? с копией Главной страницы, при явно запрете обхода в robots-е /?

Поэтому здесь эффективнее действовать через htaccess


Vladimir #:

А смотреть вы должны свой вебмастер, а не мой. И если оно туда попало, то будет долбить не один месяц.
Вы похоже в свой вебмастер совсем не заходите, или первый раз с сайтами работаете? Не похоже по дате...

Естественно не единым вордпрессом. Но дан пример, вы что не в состоянии на его основе сделать под свой сайт?
Или вам, что все на блюдечке с голубой каемочкой?))

Послушайте, что за фанаберия такая? С чего вы взяли, что кто-то должен по вашим наставлениям куда-то смотреть?

Что за высокомерие "вы похоже"? К чему все эти вальяжные гипотезы?

Есть пользовательский вопрос, обсуждается контекст вопроса и ищутся варианты ответа. 

Вы предложили свой - Ok, ваше право. Другие участники форума предлагают свои решения.


Vladimir #:
Тоже сложно пример htacces разобрать?

Мне несложно. Мне ваши примеры под WP не нужны, я даже в них не вникаю, потому что нерелевантные данные мне в настройках не нужны и я пишу нужные мне настройки самостоятельно.  Там где мне надо средиректить лишнее вида site.ru/? и у меня срабатывает редирект на Главную, а также где надо нахрен послать ссылочный спам вида site.ru/?go=http://site.ru срабатывает 403, причём с любым параметром.

В ваших же случаях, которые вы приводили - одно правило совершенно точно будет накладываться на другое, поэтому как минимум они требуют правильной очередности обработки. А второе - не универсально, о чём вам следом сообщили.  

Так что уж если решились помогать - помогайте адресно, в контексте вопроса, а не в контексте личных привычек по своему сайту.


Vladimir #:
Замечу лишь, что роботс вас не спасет от большого количества дублей страниц вида /?****

А вот здесь вы, справедливости ради, надо сказать, правы.


Vladimir #:
Которые будут периодически индексироваться, а потом выкидываться по правилу.

Здесь - нет. Если правилами запрещено, то индексироваться не будет (кроме случаев, когда правила игнорируются).

Поэтому вариантов, что сначала вопреки индексации проиндексировалось, а потом согласно старым правилам удалено из индексации - такого не бывает.

Бывает только в случае, если вы уточняете правила.

Хотя, если вдруг такое произошло, то это аномалия и этот вопрос интересно исследовать. Но в любом случае это нерелевантно общему правилу.


Vladimir #:
Самое главное правило на сайте не роботс, а правило - на сайте не должно быть дублей страниц.

Это понятно. Но иногда дубли возникают не изнутри, а снаружи, когда, например, Яндекс начинает индексировать рекламные страницы по UTM меткам из Директа, которые дублируют оригинальные страницы, поэтому здесь в любом случае идёт доп. настройка через robots.txt   

Алеандр #:
В вашем примере "site.ru/?lubaya-posledovatelnost " - это уже параметр

Формально вы правы, но рабочим параметр выглядит, когда у него есть значение т.е. вот так  site.ru/?lubaya-posledovatelnost=znachenie или хотя бы вот так  site.ru/?lubaya-posledovatelnost=

Ведь как вариант может может быть и такая конструкция  site.ru/?  где и параметр нулевый, и значение нулевое, и тогда мы вряд ли сможем зацепить нулевой параметр через  QUERY_STRING, придется разбирать строчку запроса целиком.

webinfo #:
Это надо у гугла спрашивать, почему это он вдруг решил запихивать JavaScript в индекс.

Вообще конечно любопытный пример, почему путь к js файлу попадает в индекс как самостоятельная страница.

Может быть такое, что в принципе по этому пути формируется отдельная страница с кодом 200?

webinfo #:
Если эта фраза не понятна, то поясняю: это обрабатывается сервером nginx.

Хмм.. тогда уже у меня вопрос - каким образом подобные ссылки в индекс попадают?

webinfo #:
И чего там неполного?

Конкретных рабочих примеров нет.


webinfo #:
хотя он может быть и не знает, что они у него где-то используются

О том, и речь под пример site.ru/?***** попадает и то, и другое.

minsky #:
Ты смотришь что тебе советуют, я же скинул, там всё есть

Так может быть ему частотка по отдельному городу нужна.

fliger #:
Интересное умозаключение. Откуда вы знаете, что разработчик заложил в своем скрипте, передавая в него данные через $_SERVER['QUERY_STRING']?

Безусловно, не знаю, поэтому и хочу уточнить.

Сам по себе пример - site.ru/?ssilka (site.ru/?***** - вместо звёздочек любой текст)  довольно абстрактный. Это можно быть и просто URL адрес с использование знака вопроса, а может быть и оный с get параметром в котором используется ссылка на внешний сайт. 

Если там get параметр, то конечно проще его обработать через  QUERY_STRING, но если там нет get параметра, а просто последовательность со знаком вопроса, тогда придётся через THE_REQUEST. 

Как чаще всего и бывает на форуме, вопрос неполный, поэтому и вызывает расхождения в толкованиях :)

kapec-master #:
Или как настроить чтобы по таким ссылкам отдавался код 410

Пробуйте, 

<IfModule mod_rewrite.c>

RewriteEngine on

RewriteCond %{QUERY_STRING} cb=.+$ [NC]

RewriteRule .* - [L,R=410]

</ifModule>

24Journal #:
можно подробнее пожалуйста

Подробнее - вы набираете в поиске, например, "как сформировать своё комьюнити" и ищете информацию, начать можно вот с этого материала.

Если пока в голове не очень укладывается, как так сделать; если вы просто продаете товар, то заходите, например, на сайт DNS и видите как пользователи бойко и активно люди обсуждают эти товары и их характеристики. 

24Journal :
На сайте уже более года ИКС 20 и висит не смотря на то что количество обратных ссылок растет и контент регулярный, не понятная ситуация. Что можете посоветовать

Формируйте и развивайте своё профильное комьюнити.

Всего: 12806