- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
![В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов](https://d.searchengines.guru/20/96/hacker-2-stock_600x314__f88c1615.jpg)
В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Сегодня посвятил некоторое время изучению логов и пришел в неописуемое изумление. Т.е. я и раньше видел в репортах около 3к хитов, сделанных роботом Альтависты, но руки не доходили посмотреть, что именно он ел. Лишь теплилась надежда, что робот нахонец одумался и пришел поесть давно ему скармливаемую старую версию форума. Совсем на заднем плане маячила мысль, что, может, он динамику поел. Действительность оказалась совсем иной, мрачной и непонятной.
Людям, знающим структуру старого скрипта форума - UBB - объяснять особо ничего не надо, остальным поясню. Скрипт форума, который здесь стоял раньше, генерирует статические html страницы для топиков. Причем делается это интересно - поскольку шаблоны и настройки могут меняться, то (а точнее, для обеспечения этого) все топики хранятся в текстовых файлах с расширением .cgi (но это не скрипты), а html строится с помощью базы данных по настройкам и шаблонам и данных файлов.
Так вот, вообразите мое изумление, когда я увидел, что все, что проиндексировал робот - это указанные .cgi-файлы. Я с полчаса просматривал лог, не в силах понять - как робот мог вообще узнать об их существовании? В природе не существует ссылок на них, их никто никогда не просматривал через веб - как же робот смог сформулировать запрос к ним? А потом я выловил запрос к директории ubb. И стало более-менее понятно. Каким-то образом робот зашел по адресу searchengines.ru/ubb, увидел там листинг директории и пошел по ссылкам. Ничуть не смущаясь кодом 206 или 302.
Остается только вопрос - а откуда взялся адрес типа /ubb? Ни разу, нигде такой ссылки не ставилось. Когда я сабмитил списки топиков (давно это было, правда), то там были четкие адреса html-страниц, содержащих ссылки на все топики форума. Каким образом робот их обрезал и обратился к "корневой" директории?
У кого-нибудь мысли есть на этот счет?
Остается только вопрос - а откуда взялся адрес типа /ubb?
Такое предположение. Если какой-нибудь URL выглядел как searchengines.ru/ubb?что-там , то робот мог по какой-нибудь причине отсечь знак вопроса со всем содержимым, идущим после него. Так, например, в свое время Апорт боролся с динамикой.
Нет, таких URL`ов не было никогда. Топики старого форума имели адреса типаа searchengines.ru/ubb/Forum1/HTML/000123.html
Тогда предположу, что Scooter пытается сам найти главную страницу директории и сам тыкается в searchengines.ru/ubb/, а заодно, может, и в searchengines.ru/ubb/Forum1/ и в searchengines.ru/ubb/Forum1/HTML/.
В том-то и вопрос, что в searchengines.ru/ubb/Forum1/HTML/ он не тыкался вовсе.
А, может, Scooter самостоятельно тыкаться в поддиректории четвертого уровня вложенности считает ниже своего достоинства - забирает только страницы, найденные по ссылкам. У них же раньше на сайте в хелпе было написано, что статический ранг документа зависит, в том числе, и от уровня вложенности поддиректории, в которой он лежит.
А тот же скутер был? Может какой-нибудь Scooter-forum-seeker? Типа сканирование сайта на предмет форума, чтобы не индексировать. Просто как мысль.