- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Маркетинг для шоколадной фабрики. На 34% выше средний чек
Через устранение узких мест
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Задача заключается в том, чтобы не инклюдить определенный php-код (а именно код баннерной крутилки), если страница запращивается поисковиком...
пока кроме тупой проверки $_SERVER['HTTP_USER_AGENT'] на наличие 'google','yandex' и т.д. ничего в голову не приходит...
Возможно есть другие варианты? Кто что посоветует?
Во-первых, PHP-код поисковики и так не увидят, про него знает только сторона сервера.
Во-вторых, ненужный HTML-код можно закрыть от Яндекса и Рамблера в <noindex>
Ну а самый простой способ клоачить, действительно по User-agent.
А есть у кого список юзер-агентов ботов?
Заключите код банерной крутилки в <noindex></noindex> и на все теги ссылки <a> добавте параметр rel="nofollow". Первый прием исключит индексацию блока кода для Яндекса, а второй запретит передачу PR от вашей страницы на ссылающуюся.
То, о чем вы пишете - это клоакинг (cloacking). Если этот прием будет обнаружен (а это не сложно обнаружить) однозначно получите бан. Вам это надо?
Не, вы немного не поняли, вопрос не в noindex
мне не нужно закрывать от индексации код, который сгенерит баннерка.
Опишу более подробно:
Допустим, есть у нас файл index.php
В нем есть к примеру подобное:
include('banner.php');
Т.е. инклюдится скрипт, который выводит сам баннер. Понятно, что загнать в noindex сгенеренный им код - не проблема. Но мне необходимо просто НЕ инклюдить этот banner.php. Делается это не для того, чтобы закрыть этот кусок от индексации, а для того, чтобы снизить нагрузку на сервер. Поскольку когда приходит бот какого-либо поисковика, и кроме, собственно, контента самого сайта, грузит еще и баннеры, что пагубно влияет на производительность сервера в данный момент.
да. что касается клоакинга, не сразу обратил внимание... В принципе да, это действительно в какой-то степени клоакинг, но на самом деле преследуются только положительные цели, которые я описал выше.
А вы разве не знаете, что хорошими делами прославиться нельзя 😆
Проблему надо решать в корне. А что вы будете делать, если посещаемость вашего ресурса повысится? Выборочно показывать банер каждому третьему? Смените хостинг или перенесите сайт на качественный хостинг, если вы на данный момент используете свой. Это не дорого стоит.
А как они определят, что что-то скрывают от бота? По стуку?
Откровенно говоря, я не вижу смысла решать проблему железками, если это можно сделать софтово. На странице до 4-5 рекламных тизеров, в индекс за 20 минут "бота на сайте" попадает около 10 тысяч страниц. Вместе с этим, как вы понимаете, отдается ненужных 50000 показов. Кроме того, БД, собирающая статистику баннерки, получающая 50+ тысяч новых записей - это тоже не есть гуд. Мало того, статистика отражается неверная, поскольку реклама, показанная поисковикам - не реклама (хотя это конечно можно решить внутри самой баннерки при желании).
В общем, сильно много лишних разговоров, итак, еще раз обрисую проблему:
1) Определение средствами PHP поискового бота, кроме варианта проверки вхождения слов yandex/google/etc. в user-agent. Если такой способ - самый разумный, можно ли где-то получить список user-agent поисковых роботов?
2) Клоакинг. Может ли ПС счесть подобную ерунду за клоакинг? Баннерная система работает на том же сервере, что и сам основной ресурс. Крутится на поддомене основного домена, типа ad.domen.com
юзай такую вот *** короче
if ( strstr($_SERVER['HTTP_USER_AGENT'], 'Yandex') ) { $bot='Yandex';}
elseif ( strstr($_SERVER['HTTP_USER_AGENT'], 'Googlebot') ) {$bot='Google';}
.............
и всё будет *****
в общем понятно, т.е. решение предложенное мною же в начале ветки было самым разумным.
Всем спасибо за участие в дискуссии!
Поисковые Боты
мож каму интересно будет!