юни

юни
Рейтинг
939
Регистрация
01.11.2005

Можно хотя бы тематики ресурсов огласить публично?

WhiteSmartFox, тролль чтоле? Или где?

WhiteSmartFox:
Не говоря уже о том, зачем реализовывать два разных алгоритма выдачи, и для кол-ва проиндексированных страниц реализовывать другой алгоритм выдачи, чем для простых запросов?

Не в курсе, да? Так не надо здесь долбокурилку устраивать, если не в курсе.

Psycho:
Предположим, что разница есть.

Тоже теоретег?

Разумеется, разница есть.

Psycho:
и ни разу не волнуют обычного пользователя

Какого ещё пользователя? При чём здесь, в очередной раз, пользователь? Где здесь, и кто, хоть раз сказал про пользователя, кроме любителей потроллить/пофлудить?

Первое. В случае ответа на поисковый запрос есть два принипиальных момента - 1) сравнивается содержимое разных сайтов, которое 2) нуждается в специфической сортировке. Обоих этих нюансов лишен запрос о количестве проиндексированных страниц, где не нужно ни сравнение, ни сортировка (пресловутое "по релевантности" в случае с url:site лишено смысла - какая страница, чему, и по каким признакам будет более или менее релевантна в этом случае?).

Поэтому, когда встаёт вопрос о том, отдавать ли часть страниц, или их все, то - как минимум - возникает вопрос о том, какую именно часть отдавать, и какую нет. И только в одном случае подход с частью однозначно менее ресурсоемок: если пользователю показываются те страницы, доступ к которым ПС может получить с максимальной скоростью.

Если же для этого используется тот или иной алгоритм расчёта "релевантности", то - как минимум ещё раз - встаёт вопрос о его целесообразности, именно с точки зрения экономии машинных ресурсов. Потому что для вычисления этой "релевантности" (что бы под ней не подразумевалось) так или иначе требуется взять весь массив проиндексированных страниц, обсчитать его, и по результату выдать пресловутую тысячу.

То бишь, здесь - опять же, как минимум - есть место для дискуссии, что будет экономнее: выдать пользователю заранее обсчитанный ограниченный объём данных, или же выдать ему всю информацию разом, затратив на это одну операцию и больше к ней не возвращаясь.

Троллям и флудерам - на заметку.

Второе. Я здесь появился с сугубо техническим вопросом, ответ на который - грамотный, сцуко, ответ на который - нужен мне исключительно в практических целях: поскольку через меня проходят десятки миллионов этих вот ваших сео-запросов, "пользователем не используемых, нагружающих сервера по пятисотое число, не нуждающихся в специальных алгоритмах расчёта" и прочее бла-бла-бла - то и нюансы архитектуры высоконагрузочного решения под эту задачу - как алгоритмические, так и аппаратные - интересуют меня живейшим образом.

Не долборассуждения искусствоведов на тему "зачем ботам сенокосилки?", а буквальный ответ на буквально понятый вопрос.

Это - понятно?

WhiteSmartFox:
Вы так и не придумали случай

И не собирался. Меня вообще не интересует вопрос "зачем?".

WhiteSmartFox:
(подумайте сами как можно узнать какой сайт на 500 месте в выдаче не сгенерировав 500 предыдущих)

Ещё раз - при чём здесь сайт в выдаче?

Вам понятна разница между механизмом ответа на поисковый запрос, и механизмом ответа на запрос о количестве проиндексированных страниц? О каком кешировании речь? О какой генерации, и чего именно?

"Закончатся" и "исчезнут" - разные вещи. Да и счётчик этот фейковый.

MAGiYA:
Людям с больным желудком вообще нельзя горячий свежевыпеченный хлеб

Дык, а почему?

Магистральщики чо-та химичат, не иначе. Ждать надо.

vivaa:
кушать такой свежий хлеб - очень вредно

Почему? 10 хп.

Адепт, в Яндексе-то? Не только догадываются, но и обмениваются не критичной технической информацией (как на конференциях а-ля Highload, так и лично/корпоративно).

Тут ведь и с алгоритмической, и с инфраструктурной точек зрения не так много места для манёвра, когда речь идёт о сборе статистики. Методы у всех примерно одинаковые.

Вам самим, кстати, не надоела тутошняя Курилка, устроенная в последние пару недель?

Miha Kuzmin (KMY), а ты чо, за вакцинацию, типа?

Всего: 35050