юни

юни
Рейтинг
933
Регистрация
01.11.2005
((GoodWin)):
это параметры извне, их не рассматриваем, ибо это поведенческий анализ

Как раз из-за этого - рассматриваем, со страшной силой.

((GoodWin)):
ОСТАВШЕЙСЯ скудности параметров мы можем наблюдать чудовищное СЕГОДНЯШНЕЕ многообразие

Домыслы, и про скудность, и про разнообразие. Отдельный пользователь может вести себя как угодно, а в массе своей они вполне одинаковы. Другое дело, что резкое выделение из "серой массы" ещё не повод для санкций, а лишь для дополнительного анализа - но это уже второй вопрос.

((GoodWin)):
сделаны СЕГОДНЯ огромным разнообразием разработчиков самой РАЗНОЙ квалификации

Это здесь вообще не причём. С таким же успехом можно сделать акцент на домашних животных разработчиков, их жизнь в постиндустриальную эпоху и под влиянием надвигающегося 2112 года.

((GoodWin)):
мгновенно превратятся в алгоритмический ненужный хлам

Ну конечно. Даже не в доли секунды, а ну просто мгновенно.

Ничто не мешает отслеживать в реальном времени все изменения - достаточно их постоянно собирать и оперативно реагировать на флуктуации. Только и всего. А мгновенные/резкие изменения возможны лишь при неграмотной попытке искусствено на них повлиять. Вот тогда да, все наработки придут в полное изумление и прострацию. В реальной же жизни пользователи мгновенно меняют поведение (тем более, в Сети) в исключительно редких случаях.

Например, подивившись чьим-то смелым выводам на каком-нибудь форуме.

Helz:
накопленные данные будут устаревать раньше

Да с чего Вы взяли-то? Кто-нибудь, хотя бы из читающих эти строки, хоть раз в жизни резко менял свои ежедневные маршруты в Сети? И часто это происходило?

Одни домыслы...

Можно хотя бы тематики ресурсов огласить публично?

WhiteSmartFox, тролль чтоле? Или где?

WhiteSmartFox:
Не говоря уже о том, зачем реализовывать два разных алгоритма выдачи, и для кол-ва проиндексированных страниц реализовывать другой алгоритм выдачи, чем для простых запросов?

Не в курсе, да? Так не надо здесь долбокурилку устраивать, если не в курсе.

Psycho:
Предположим, что разница есть.

Тоже теоретег?

Разумеется, разница есть.

Psycho:
и ни разу не волнуют обычного пользователя

Какого ещё пользователя? При чём здесь, в очередной раз, пользователь? Где здесь, и кто, хоть раз сказал про пользователя, кроме любителей потроллить/пофлудить?

Первое. В случае ответа на поисковый запрос есть два принипиальных момента - 1) сравнивается содержимое разных сайтов, которое 2) нуждается в специфической сортировке. Обоих этих нюансов лишен запрос о количестве проиндексированных страниц, где не нужно ни сравнение, ни сортировка (пресловутое "по релевантности" в случае с url:site лишено смысла - какая страница, чему, и по каким признакам будет более или менее релевантна в этом случае?).

Поэтому, когда встаёт вопрос о том, отдавать ли часть страниц, или их все, то - как минимум - возникает вопрос о том, какую именно часть отдавать, и какую нет. И только в одном случае подход с частью однозначно менее ресурсоемок: если пользователю показываются те страницы, доступ к которым ПС может получить с максимальной скоростью.

Если же для этого используется тот или иной алгоритм расчёта "релевантности", то - как минимум ещё раз - встаёт вопрос о его целесообразности, именно с точки зрения экономии машинных ресурсов. Потому что для вычисления этой "релевантности" (что бы под ней не подразумевалось) так или иначе требуется взять весь массив проиндексированных страниц, обсчитать его, и по результату выдать пресловутую тысячу.

То бишь, здесь - опять же, как минимум - есть место для дискуссии, что будет экономнее: выдать пользователю заранее обсчитанный ограниченный объём данных, или же выдать ему всю информацию разом, затратив на это одну операцию и больше к ней не возвращаясь.

Троллям и флудерам - на заметку.

Второе. Я здесь появился с сугубо техническим вопросом, ответ на который - грамотный, сцуко, ответ на который - нужен мне исключительно в практических целях: поскольку через меня проходят десятки миллионов этих вот ваших сео-запросов, "пользователем не используемых, нагружающих сервера по пятисотое число, не нуждающихся в специальных алгоритмах расчёта" и прочее бла-бла-бла - то и нюансы архитектуры высоконагрузочного решения под эту задачу - как алгоритмические, так и аппаратные - интересуют меня живейшим образом.

Не долборассуждения искусствоведов на тему "зачем ботам сенокосилки?", а буквальный ответ на буквально понятый вопрос.

Это - понятно?

WhiteSmartFox:
Вы так и не придумали случай

И не собирался. Меня вообще не интересует вопрос "зачем?".

WhiteSmartFox:
(подумайте сами как можно узнать какой сайт на 500 месте в выдаче не сгенерировав 500 предыдущих)

Ещё раз - при чём здесь сайт в выдаче?

Вам понятна разница между механизмом ответа на поисковый запрос, и механизмом ответа на запрос о количестве проиндексированных страниц? О каком кешировании речь? О какой генерации, и чего именно?

"Закончатся" и "исчезнут" - разные вещи. Да и счётчик этот фейковый.

MAGiYA:
Людям с больным желудком вообще нельзя горячий свежевыпеченный хлеб

Дык, а почему?

Магистральщики чо-та химичат, не иначе. Ждать надо.

vivaa:
кушать такой свежий хлеб - очень вредно

Почему? 10 хп.

Адепт, в Яндексе-то? Не только догадываются, но и обмениваются не критичной технической информацией (как на конференциях а-ля Highload, так и лично/корпоративно).

Тут ведь и с алгоритмической, и с инфраструктурной точек зрения не так много места для манёвра, когда речь идёт о сборе статистики. Методы у всех примерно одинаковые.

Вам самим, кстати, не надоела тутошняя Курилка, устроенная в последние пару недель?

Всего: 34981