- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Несмотря на то, что в роботс.тхт стоит запрет, "быстрый" робот яндекса проиндексировал страницу вида "адрес сайта/add_news.php". Правда, в адресе есть еще идентификатор сессии, может быть это повлияло?
файл robots.txt:
User-Agent: *
Disallow: /reg.php
Disallow: /add_news.php
Яндекс что, к роботс не обращается?
"Правда, в адресе есть еще идентификатор сессии, может быть это повлияло?"
Ну так.
-=Илья=-, причем тут идентификатор, если начальная строка указана ?
Ага, проиндексированная ссылка выглядит так:
адрес_сайта/add_news.php?PHPSESSID=111f542c5168e87bdfcf52893ac63d4c
так что я не думаю, что сессия тут как-то повлияла.
Но даже если и так, то возникает другой вопрос - почему Янд индексирует страницы с сессиями, если в коде указано, что для user agent Яндекса сессии не должны открываться?
Код такой:
$user_agent = $_SERVER["HTTP_USER_AGENT"];
if (!(eregi('yandex',$user_agent))) {
session_start();
}
А какой бот приходил (с какой буквой)? Как Вы узнали, что это "быстрый" робот?
Можно попробовать поэкспериментировать и сделать в robots.txt отдельную секцию для Яндекса:
Disallow: /reg.php
Disallow: /add_news.php
User-Agent: Yandex
Disallow: /reg.php
Disallow: /add_news.php
Хуже быть не должно, будет ли лучше - нужно пробовать.
Приходил бот с буквой I.
А насчет "быстрого" робота - когда яндекс анонсировал его появление, они писали, что можно увидеть результаты его работы в выдаче проиндексированных страниц сайта следующим образом - рядом со ссылкой стоит время (какое кол-во часов назад данная страница проиндексирована). В общем, выглядит это так:
адрес_сайта/add_news.php?PHPSESSID=111f5cf893ac63d4c (48 КБ) · 10 часов назад
NULL, спасибо, я попробую.
А по поводу сессий кто-нибудь что-нибудь может сказать?? ни в одном форуме не могу найти ничего толкового... Знаю, что многие сталкивались с этой проблемой, поделитесь опытом, пожалуйста!
Не знаю, у меня пока проблем нет. Я правда через strstr проверяю :)
add_news.php судя по всему для Яндекса является конкретной страницей (здесь эта проблема в каком-то топике поднималась). Попробуйте написать add_news (тогда уж точно он должен запретить все, что начинается с add_news).
-=Илья=-, причем тут идентификатор, если начальная строка указана ?
При том, что эта начальная строка указывает Яндексу конкретный файл. Я уже пробовал запретить так страницы пользователей на форуме от индексации (вид index.html?user&eshe-chto-to) - не помогало. Правильнее наверное будет запрещать "file.php?". Но от идентификаторов сессий всё равно надо избавляться.