Miha Kuzmin (KMY), а ты чо, за вакцинацию, типа?
Вами же и повторена.
RDS bar, а как провайдер определяется?
Не могу сказать, что он мне сильно понятен. Каким образом это относится к обсуждаемой ситуации?
Подавляющее большинство которой находится под постоянным контролем, не просто же так я про большие числа упомянул.
У Яндекса под рукой колоссальные массивы данных, при наличии которых даже такие (кажущиеся местным сеошникам экзотическими) случаи, как, например, разница "отказа" и "возврата" для сайта круглосуточного такси и онлайн-библиотеки - будет не какой-то ставящей в тупик проблемой, а обыденой ситуацией, имеющей чёткую корреляцию на сотнях графиков, полученных с тысяч ресурсов.
Видимо, Вы просто не представляете себе объёмы этой статистики.
Или пятитысячной.
Оно и так этим занимается. Нет никакого "одного парсера для одного сайта".
Насколько я представляю себе архитектуру, разница в нагрузке между выдачей 1.000 и 50.000 результатов - существенно меньше, чем разница между 5 и 1.000 результатов.
Проще вообще не обрабатывать такого рода запросы, чем выбирать часть по каким-то критериям, отнимающим дополнительные ресурсы на их пересчёт.
Зорро:), проблема у любой пирамиды одна, но фатальная: прибыль участников создаётся из средств новых вкладчиков, и ни из чего другого.
Этот принцип можно оборачивать в любые красивые обёртки из красноречия и хитромудрия, что никак не скажется на результате: 1) первые участники, возможно, окажутся в плюсе, 2) большинство остальных неизбежно проиграет, и 3) сама схема - обречена.
При чём здесь бесполезность? Где её критерии? В чём польза не от сотой, а от пятидесятой страницы? Кто из пользователей ищет не дальше пятидесятой, а дальше пятой?
Это всё досужие рассуждения, а я говорю о технических ограничениях.
Я не вижу существенного возрастания нагрузки. Разве что на каналы.
Это и непонятно.
Пример поискового оператора можно сразу?
Alex91, вот я и спрашиваю, что значит генерить?
Если они уже проиндексированы (обработаны), то в чём состоит генерация? Выдернуть из базы уже содержащиеся там данные, соответствие титла и урла - это совсем не то, что найти в поисковом индексе ответ на запрос пользователя и выдать его в соответствии с определяющими релевантность алгоритмами.
В чём состоит якобы существенное увеличение нагрузки?
А подробнее?
Так как посмотреть тысяче первую страницу?
А в чём может быть нагрузка, интересно? Если страницы действительно проиндесированы, на них уже есть сохранённая копия, то в чём проблема выдать их все по запросу, а не только часть?