Сайтик может быть не интересен, но машина, на которой размещён сайтик, может быть интересна.
Если такой вопрос, то лучше наймите того, кто умеет это делать.
Для понимания смысла изучаемого текста надо делать наоборот, при этом не ограничиваться одним изучаемым текстом, а находить разницу между изучаемым текстом, и набором текстов на разные темы.
CDN здесь не сайт начальника темы, а прокси с кэшированием.
Возможно HTML страницы все в кэше, а для видео у них мало места, поэтому приходится подгружать. Если публика через прокси не понимает Вашу рекламу, или эта реклама не показывается для их страны, то доход не должен увеличиваться. Поэтому надо думать. Для добычи дохода можно клеить в начало видео файлов рекламу, которая будет понятна такой публике. Можно начать с заставки МЕСТО ДЛЯ ВАШЕЙ РЕКЛАМЫ на официальных ООН языках, с адресами для связи. Только для файлов, которые отдаёте в эту сторону, а всем остальным посетителям отдавать файлы без дополнительной рекламы.
Вы так пишете, как будто это что-то плохое. Умные люди с посещаемыми сайтами платят деньги за CDN (content delivery network) сервисы, а здесь это мясо само приползло.
Вирусная посещаемость может как появиться, так и пропасть, или появляться при редких условиях. Если это действительно Саудовская Аравия, то было бы лучше не запрещать, а использовать такое счастье.
Не обязательно целой страной, там достаточно богатых людей. Ваше описание похоже на работу прокси с кэшированием.
https://developer.amazon.com/amazonbot
Reverse DNS lookup, который советуют для проверки, есть PTR запись в ответе DNS сервера. Для IP номеров из Вашего списка ответы DNS сервера такие.
55.5.11.52.in-addr.arpa. 218 IN PTR ec2-52-11-5-55.us-west-2.compute.amazonaws.com. 94.9.211.34.in-addr.arpa. 79 IN PTR ec2-34-211-9-94.us-west-2.compute.amazonaws.com. 32.161.11.52.in-addr.arpa. 43 IN PTR ec2-52-11-161-32.us-west-2.compute.amazonaws.com.
Никаких (crawl.amazonbot.amazon) не найдено, то есть похоже, что кто-то маскируется под (Amazonbot-Video) робота. Возможно, это хитрые живые люди смотрят кино через прокси с кэшированием. А почему, и какие люди, надо думать, а для этого надо лучше изучать обстановку.
Вы пишете слишком мало для ответа на вопросы.
1. Какие User Agent в логах при запросах от прожорливых IP номеров?
2. Скачивают много разных файлов по одному разу каждый файл, или мало разных файлов много раз каждый файл?
Адрес Вашего сайта (или некоторых файлов) мог попасть в какую нибудь страну, пользователи из которой могут получать Ваши файлы только через прокси, и вирусно передаваться между пользователями. Тогда запретом IP номера (и тем более многих IP номеров) Вы можете отказать этим посетителям. А страна может быть богатая, например Саудовская Аравия, и реклама на неё может быть прибыльная.
1. Разные способы для разных искалок.
2. Изучайте конкурентов, и делайте лучше.