из тех, которые тут приводятся 99.9% блокируются несколькими строками кода + ничто не мешает составить список валидных для системы и стандартных примочек ключей в GET и либо отсекать лажу, либо canonical прописывать автоматом (а ля MODx) + если есЧо дать возможность жёсткие алиасы в БД прописывать (опять же MODx), то в каком-нибудь местечковом "strict" режиме дублей не будет по определению...
да не было никаких иллюзий, всё ж в открытом доступе :) кто хотел - был в курсе. и никакой могилы нет, просто надо держать руку на пульсе.
да SMS-ки пусть скрипт шлёт на скайп, если заказчику так припёрло...
этот типичный "дубль" стоит везде по умолчанию закрывать в htaccess или конфиге nginx и не тревожить бедного кодера ;) заодно и редирект мала-мала быстрее отработает...
что поисковики распознают и индексируют XML с html-корнем это загадкой не было ;), но как ранжируют? до недавнего времени гугел в рекомендациях прямо заявлял типа "xml проиндексируем, но в ранжировнии text/html в приоритете", сейчас вроде бы уже смирился, а вот яшка наверняка только догоняет.
я же не просто так яху вспомнил, который xslt отрабатывал почти в полном объёме, media-type в output точно отлавливал...
на вскидку достаточно очевидно: в эти 10-15 лет как раз был взрывной период формирования рынка и стандартов, причём объём контента рос на 99.99% за счёт "нубов" (в разных смыслах).
кодеры вполне обходились более простыми для освоения средствами, создавая менее изящные но быстрее реализуемые решения => поисковики, кроме яху и чуть-чуть гугла, строили базы и ранжирование прежде всего на text/html контенте => кроме сложности появилась доп причина пренебрегать XSLT, и так по кругу. да и броузеры б/м устаканили работу парсеров не так давно.
+1
и к разгоревшейся дискуссии о "чистоте урлов" могу добавить 2 разА по 5 центов от MODx :
ещё более плаксивые статьи писались в 2002-3 когда доткомы по полной сдулись. и про то что денег в тырнете нет и про то что любой стартап теперь загнётся без бешеных вливаний. и что в результате? видно у Цукерберга компа не было в это время, а то не занялся бы мальчик из хорошей еврейской семьи безнадёжным бизнесом...
expires -1;
http://nginx.org/ru/docs/http/ngx_http_headers_module.html
отрицательное время — “Cache-Control: no-cache”.
у меня именно так прописано в нужных местах типа
location ~* \.(?:html|xml)$ { try_files $uri $uri/ @rewrite; expires -1; access_log off; }
и работает...
Pavel_, при всех ваших оголтелых понтах 😂 вы дааалеко не дурак. просто о разных вещах "полемизируем", ширше на вопрос посмотрите и всё встанет на свои места. саму схему надо оценивать...