Таких слов не слышал. Да и смысла "единого" кеша просто нет.
Если ВЫ хотябы частично понимаете смысл работы распределенных серверов и БД, то должнв понять, что нагрузка не зависит от этого. Тольок, чуть-чуть выростает трафик.
Очень надеюсь что скоро, мусор типа семонитора, промоутера и т.д. станет вне закона.
На счет выдачи:
Скорее всего, проблема не в количестве результатов на странице, а в принцыпе формирования базы. Яша утверждал, что БД перестала быть кластерной, но суть не поменялась. Ведь фронт-сервер, это не просто комп, это некое количество компутеров, которые работают на единый результат. А значит, могут возникать "колизии". Ведь для ПС глупо использовать алгоритм транзакций.
И еще, поймите, Задача ПС искать, а не "держать" позиции тех, кто вам интересен. Да и "позиция в серпе" - штука очень нестабильная. При этом, нестабильность, тем выше, чем частотней запрос.
А чем больше вы его мониторите, тем более частостным он становится!!!
Как для гугла, так и для яши (для индексации) важно количество а не качество ссылок. Придет очередь и все будет ок.
У гугла просто очередь быстрее движется
очень логично. Если Вы ищете фрагмент текста, то какая разница где вы его найдете.
Это совсем другое. Вы путает просто понятия.
Это нормально:
1. База фронт-серверов серпа и XML - не синхронны, особенно в момент апа.
2. Закеширована выдача в разные момент.
3. Разные фронт-сервера отдали результат.
Полностью бредовы оба утверждения.
1. о платном уже давно можно забыть. Чтайте внимательно яшу и форум.
2. Сервис XML, презде всего, создавался для реализации поиска по сайту/семейству сайьтов, а не для всяких парсерок и т.д.
-AlexK-, seo-alex, Вы рассуждаете так, как будто компУтер, броузер и сам инет - это нечно живое.
Все проще. Все обычный асинхронный поток данных.
Что значит "вернулся на страницу поиска" - переключился между окнами, закладками (опера и ие 7) или откатился назад (как у вражеского гугла)?
Время, пользователи и т.д. при асинхронном обмене - штуки не такие предсказуемые.
Что может интересовать яшу?
1. на какие запросы как реагирует юзер (жмет ссылку, директ, еще с сайта или сохраненную копию)
2. Глубина просмотра серпа по запросам и регионам.
3. последовательность уточняющих запросов и переходы по ним.
4. Явное избегание каких-либо сайтов, что тоже очень полезно
Яша проверяет кликабельность тольок для своих нужд, понимая что при ином раскледе, "закликаю" его всяким софтом.
И еще, обратите внимание, как работает это штука. Подгрузка рисунка в тени из JS. никто не сможет 100% гарантировать его загрузки и некеширование.
Как именно яша принимает решение о кодировке, - сказать немогу. Можно взять снифер и посмотреть. Могу дать предположения. Новое и старое окно где-то дает разную информацию в заголовке запроса:
1. JS ставит временный кук, который анализируется яшей (при первом входе кука нет)
2. По полу Referer
3. По информации сессии, которая откывается на серваке.
4. Инфа берется их поля USER-AGENT, но реакция появляется тольок после пострного входа.
И еще много чего. Ведь там программеров много.
И еще, скрипт, генерирующий страницу, получает данные из Perl (для которого UTF - это ад), C - здесь проще. + фронт сервера (ведь самое грамотное, создавать сессию, а потом юзера кидать на другой сервак.)
Елистратов,
так выглядит UTF при декодировании по WIN2151. Сменой кодировки броузера это не лечится. На стороне сервака идет декодирование, с неверным указанием энкодера источника.
Видимо яша хочет отдавать серп в кодировке, которую точно понимает (хочет) юзер.
очень улюбнуло....
выбы еще сказали, что она универсальна, потому, что на мобилах (WAP) она юзается...
Если говорить по сути, штука очень универсальная (UTF-8) а значит не удобная и грамоздкая. Яша всегда пользовал базы в KOI-8r(u), как наиболее удобные и компактные. Возможно, с вводом новых мощностей, будет пытаться перейти на что-то более монстральное, хотя при этом придется переписать всех ботов. Наверное и качу роботв базы тоже....
extreem,
тормоза связаны с с тем, что PPB, и другие бесполезные штуки, просто кешируют значения, дабы постоянно не дергать самого яшу (кеш живет 1-2 недели)
Значения они берут с яндекс-бара, а он сам, как правило, на недельку тормозит от апа каталога.
Вот вам и задержка