Pchelorussia

Рейтинг
75
Регистрация
16.05.2011
Вот что может в индекс попереть...

Такое уже было - всё закрыл от индексирования - сработало. Но хочется всё настроить как следует

Andreyka:
Ну так сами и напишите .htaccess. Что за вопрос?

Спасибо, знал бы как - не создавал бы топик. Прошу прощения за нубовский вопрос, но будет ли работать такая директива в .htaccess, если фронтендом установлен nginx?

Кстати, нашёл похожий топик /ru/forum/817060,

где для запрета доступа к странице /index.pl?get_id=5 предлагается следующая конструкция:

if ($request_uri = "/index.pl?get_id=5") {
return 404;
}

Можно ли задать подобное условие по маскам

page.html*

page.pdf*

?

Большое спасибо! - не ожидал такой развёрнутой дискуссии

ПДФ ка в легкую зайдет в топ Яндекса, только смысла это для сайта не принесет
Вот документ проиндексировался, вышел в топ, люди на него заходят и читают. Что получите с этого лично вы, кроме счета за хостинг?

Но разве это не улучшит поведенческие факторы и не подтянет другие страницы в поиске? (даже без ссылок в документе на ресурс-источник)

найти вам способ массового редактирования ваших пдф

Безусловно, хотелось бы, но тут кроме технических есть и другие сложности- ведь помимо pdf существуют и другие форматы

Впрочем, как вариант, для маркировки документов можно нанять школьника :) Но опять же - есть ли в средне- и долгосрочной перспективе в этом экономический смысл? Склоняюсь к той мысли, что всё же есть

pegs:
А проблема в злоупотреблении правообладателя ТЗ своим правом и косяках Роспатента и судов, из-за действий которых происходят эти безобразия.

Что делать, это Россия..., закон могут вывернуть так, как нужно...

врятли type-in получишь

но почему-то всевозможные googli.ru скуплены пачками. Хотя возможно, здесь расчёт на перепродажу... например, под фанпроект ☝ К слову, нашёл вот нечто похожее: http://owebmoney.ru - и посещаемость ведь неплохая! И тогда возникает ещё один вопрос: возникнут ли претензии у Яндекса к ресурсу oyandexe.ru? :)

Спасибо за ответ, а уж думал - форум на летнем отдыхе :) Тоже склоняюсь к тому, что дополнительные файлы с уникальным контентом улучшат ранжирование сайта по различным запросам.

pupseg:
что в .htaccess ?

Только директива AddType application/x-httpd-php5 .htm .html .php

Проблема в вашей CMS

CMS как таковая отсутствует, сайт самописный: html + php инклуды + js/php скрипты

может можно и обойтись хитрым редиректом

Редирект - это, конечно, неплохо, но странно - почему сервер не отдаёт 404 ошибку - ведь этих страниц фактически не существует в директории сайта

87793:
Т.е. XXauto.ru попадало под претензии, а вот autoXX.ru - нет.

А разве auto -не общеупотребительное слово? И в чём логика? ...хотя, например, igoogle.ru, гораздо круче, чем googli.ru:)

Кстати, возвращаясь к googl - я обнаружил очень много занятых доменов с вхождением этого буквосочетания. Уважаемые домейнеры, если не секрет - тайп-ин трафик? ...или какая-то тёмная сторона домейнинга? 🍿

А, кстати, если что-то удаётся придумать с высоким количеством тайп-ин заходов?

---------- Добавлено 07.07.2015 в 06:17 ----------

Doma-in, спасибо, думаю даже не ответят. Учитывая их общительность в других сервисах :)

Однако ж, да, вот ещё сабж: http://googloid.org - с дикой посещаемостью

А по прямому брендовому запросу защитились они отлично:

https://yandex.ru/search/?lr=21&text=google - налепили больше десятка зеркал:)

Страницы у ТС-а уже в индексе и, прежде всего, нужно закрыть мусор

rifleman:
Что бы убрать мусорные страницы, надо изменить поведение php скрипта который их генерирует.

Если сайт самописный (html + инклюды + скрипты), то виноват почти 100% не какой-то определённый php-скрипт, а внутренние относительные ссылки вида <a href="razdel/page.php">, которые и "плодят" именно такие многоэтажные урлы.

И тогда с практической точки зрения Disallow достаточно - по крайне мере, у меня вот уже несколько лет Яша может и видит, но НЕ ВЫКАЧИВАЕТ "всё это добро" (что самое главное), а юзеры подобные адреса набирают довольно редко :) Впрочем, сейчас как раз и будет такой редкий случай - здесь, безусловно, качественное решение - редирект или 404:

/ru/forum/901874

Давайте спросим у админов Сёрча ,как?☝

Если функциональности хватает, то движок совершенно ни к чему. Самый простой вариант Disallow: /razdel/*.php/* (лично мне помогло).

Всего: 213