Можно хотя бы тематики ресурсов огласить публично?
WhiteSmartFox, тролль чтоле? Или где?
Не в курсе, да? Так не надо здесь долбокурилку устраивать, если не в курсе.
Тоже теоретег?
Разумеется, разница есть.
Какого ещё пользователя? При чём здесь, в очередной раз, пользователь? Где здесь, и кто, хоть раз сказал про пользователя, кроме любителей потроллить/пофлудить?
Первое. В случае ответа на поисковый запрос есть два принипиальных момента - 1) сравнивается содержимое разных сайтов, которое 2) нуждается в специфической сортировке. Обоих этих нюансов лишен запрос о количестве проиндексированных страниц, где не нужно ни сравнение, ни сортировка (пресловутое "по релевантности" в случае с url:site лишено смысла - какая страница, чему, и по каким признакам будет более или менее релевантна в этом случае?).
Поэтому, когда встаёт вопрос о том, отдавать ли часть страниц, или их все, то - как минимум - возникает вопрос о том, какую именно часть отдавать, и какую нет. И только в одном случае подход с частью однозначно менее ресурсоемок: если пользователю показываются те страницы, доступ к которым ПС может получить с максимальной скоростью.
Если же для этого используется тот или иной алгоритм расчёта "релевантности", то - как минимум ещё раз - встаёт вопрос о его целесообразности, именно с точки зрения экономии машинных ресурсов. Потому что для вычисления этой "релевантности" (что бы под ней не подразумевалось) так или иначе требуется взять весь массив проиндексированных страниц, обсчитать его, и по результату выдать пресловутую тысячу.
То бишь, здесь - опять же, как минимум - есть место для дискуссии, что будет экономнее: выдать пользователю заранее обсчитанный ограниченный объём данных, или же выдать ему всю информацию разом, затратив на это одну операцию и больше к ней не возвращаясь.
Троллям и флудерам - на заметку.
Второе. Я здесь появился с сугубо техническим вопросом, ответ на который - грамотный, сцуко, ответ на который - нужен мне исключительно в практических целях: поскольку через меня проходят десятки миллионов этих вот ваших сео-запросов, "пользователем не используемых, нагружающих сервера по пятисотое число, не нуждающихся в специальных алгоритмах расчёта" и прочее бла-бла-бла - то и нюансы архитектуры высоконагрузочного решения под эту задачу - как алгоритмические, так и аппаратные - интересуют меня живейшим образом.
Не долборассуждения искусствоведов на тему "зачем ботам сенокосилки?", а буквальный ответ на буквально понятый вопрос.
Это - понятно?
И не собирался. Меня вообще не интересует вопрос "зачем?".
Ещё раз - при чём здесь сайт в выдаче?
Вам понятна разница между механизмом ответа на поисковый запрос, и механизмом ответа на запрос о количестве проиндексированных страниц? О каком кешировании речь? О какой генерации, и чего именно?
"Закончатся" и "исчезнут" - разные вещи. Да и счётчик этот фейковый.
Дык, а почему?
Магистральщики чо-та химичат, не иначе. Ждать надо.
Почему? 10 хп.
Адепт, в Яндексе-то? Не только догадываются, но и обмениваются не критичной технической информацией (как на конференциях а-ля Highload, так и лично/корпоративно).
Тут ведь и с алгоритмической, и с инфраструктурной точек зрения не так много места для манёвра, когда речь идёт о сборе статистики. Методы у всех примерно одинаковые.
Вам самим, кстати, не надоела тутошняя Курилка, устроенная в последние пару недель?
Miha Kuzmin (KMY), а ты чо, за вакцинацию, типа?