Тогда оттуда и тянуть, я не думаю, что где-то значимо будет дешевле.
Можно конечно попытать счастья на кворке (если кто-то подобным специально занимается), но вряд ли, слишком узкоспециализированная задача.
Структурировать там и не надо :)
Если в складчину брать, то соответственно будет дешевле.
Подключили.
А кто ж такой объём запросов лопатить будет?
Это до пенсии :)
Если в таком объёме, то по API с Кейсо самый резонный вариант.
В таких объёмах тянуть через прокси с аккаунтам - изнурительное и слишком трудозатратное дело.
Как вариант арендуйте корпоративный аккаунт, там сейчас хорошие лимиты.
300K запросов на корпоративном. Нередко и они не выбираются.
Кейсо и ещё раз Кейсо. По функционалу и возможностям они круто оторвались от всех конкурентов.
Адекватно. Мы берем корпоратив на 5 человек.
300K запросов в месяца на 5 человек, часть из которых и не добирают свой объём покрывает практически полностью весь объём по семантике, которые я веду по своему перечню клиентов.
Я уже давно не вижу на форуме SEO-шников, которые бы серьёзно занимались запросной аналитикой и работали с большими объёмами.
В Кейсо.
Конечно ничего не надо придумывать.
Не пуcтая и полезная (+ конкурентная) - далеко не синонимы.
Наполнить страницу в связи с бурным развитием AI инструментов нет никак особых проблем, а вот удержать в индексе, получить трафик и удержать в долгосрок на позициях задача уже не такая тривиальная.
Более того, категорически не надо индексировать пустые страницы. Проиндексировать пустую страницу - это фактически дать понять ПС, что по данному адресу нет никакой ценности, поэтому чаще всего такие страницы, даже если и заходят в индекс, то всё равно потом выпадают и это уже минус к поисковой авторитетности сайта.
Планировать индексацию нужно и важно, когда есть полезный контент.
Никак. Не может быть такой рабочей задачи, где ПС нужно индексировать страницы, только потому что у вас (или у кого-либо) есть намерения.
Таких сайтов сотни и тысячи. С отзывами, трафиком и живой активностью.
Только фактических содержимым.
Вот такая проблема. Не пишите плиз бросить эту идею, сайт будет на десятилетия.
Проблема тут только в том, что сама по себе идея:
а) Глубоко вторична
б) Не имеет своей уникальной и отличимой ценности
ЧТД (как любила писать учительница по геометрии - что и требовалось доказать).
В результате - учим AI, контролируем, корректируем и ведём необходимую настройку на результат, которая в деталях будет понятна только в процессе.
Он на кичу отлетел за содержимое форума
Откуда такая информация?
Если прям совсем лайтовые, тогда чаще всего это мистические триллеры.
Классика:
Шестое чувство
Догвилль
Ключ от всех дверей
Женщина в чёрном
Астрал
Паранормальное явление
Синистер
Зеркала
Прочь
Приют
Мертвая тишина
... а дальше по рекомендациям от этих фильмов.
Всегда разные показывали.
Доля бот трафика увеличилась, вот в результирующих оценках, в зависимости от фрода, где фильтруются боты, данные так сильно и разнятся.
Смотрите в Метрику. Понятно, что какую-то часть живых пользователей она может не учитывать, но плюс минут такая ситуация у всех.
Любая система измерений относительна.
p.s. Есть ещё логи сервера (выше сказали), но вести аналитику там как правило сложнее, ввиду дороговизны хороших аналитических инструментов, поэтому можете использовать их, как "сырые" данные для анализа. Но там тоже есть очень серьёзна проблема, там как правило довольно серьёзные колебания в трафике от сторонних бот-краулеров и их колебания весьма проблемно соизмерять с долей живого трафика. Здесь мы снова возвращаемся к той же Метрике.