T.R.O.N

T.R.O.N
Рейтинг
314
Регистрация
18.05.2004
Nikolai Popkov:
Сейчас, по словам сотрудника Яндекса, такого нет.

Таких слов не слышал. Да и смысла "единого" кеша просто нет.

Nikolai Popkov:
Semonitor, кстати, чтобы меньше грузить Яндекс берет выдачу именно по 50

Если ВЫ хотябы частично понимаете смысл работы распределенных серверов и БД, то должнв понять, что нагрузка не зависит от этого. Тольок, чуть-чуть выростает трафик.

Очень надеюсь что скоро, мусор типа семонитора, промоутера и т.д. станет вне закона.

На счет выдачи:

Скорее всего, проблема не в количестве результатов на странице, а в принцыпе формирования базы. Яша утверждал, что БД перестала быть кластерной, но суть не поменялась. Ведь фронт-сервер, это не просто комп, это некое количество компутеров, которые работают на единый результат. А значит, могут возникать "колизии". Ведь для ПС глупо использовать алгоритм транзакций.

И еще, поймите, Задача ПС искать, а не "держать" позиции тех, кто вам интересен. Да и "позиция в серпе" - штука очень нестабильная. При этом, нестабильность, тем выше, чем частотней запрос.

А чем больше вы его мониторите, тем более частостным он становится!!!

Как для гугла, так и для яши (для индексации) важно количество а не качество ссылок. Придет очередь и все будет ок.

У гугла просто очередь быстрее движется

jump:
Как то не логично.

очень логично. Если Вы ищете фрагмент текста, то какая разница где вы его найдете.

jump:
Человек скажем ищет "чайник модели 1"

Это совсем другое. Вы путает просто понятия.

Bear666:
Кто знает, может подскажет, почему xml выдача Яндекса отличается от той, что показывает серп того же Яндекса? (просто по множеству запросов вижу разные результаты, может есть особые приемчики по работе с xml Яндекса?)

Это нормально:

1. База фронт-серверов серпа и XML - не синхронны, особенно в момент апа.

2. Закеширована выдача в разные момент.

3. Разные фронт-сервера отдали результат.

Bear666:
в платной и бесплатной выдаче xml?
Bear666:
Свободны и платный доступ к XML как и был сделан для вебмастеров и оптимизаторов, а простой пользователь, как Вы выразились, даже и не подозревает о его существовании.

Полностью бредовы оба утверждения.

1. о платном уже давно можно забыть. Чтайте внимательно яшу и форум.

2. Сервис XML, презде всего, создавался для реализации поиска по сайту/семейству сайьтов, а не для всяких парсерок и т.д.

-AlexK-, seo-alex, Вы рассуждаете так, как будто компУтер, броузер и сам инет - это нечно живое.

Все проще. Все обычный асинхронный поток данных.

Что значит "вернулся на страницу поиска" - переключился между окнами, закладками (опера и ие 7) или откатился назад (как у вражеского гугла)?

Время, пользователи и т.д. при асинхронном обмене - штуки не такие предсказуемые.

Что может интересовать яшу?

1. на какие запросы как реагирует юзер (жмет ссылку, директ, еще с сайта или сохраненную копию)

2. Глубина просмотра серпа по запросам и регионам.

3. последовательность уточняющих запросов и переходы по ним.

4. Явное избегание каких-либо сайтов, что тоже очень полезно

Яша проверяет кликабельность тольок для своих нужд, понимая что при ином раскледе, "закликаю" его всяким софтом.

И еще, обратите внимание, как работает это штука. Подгрузка рисунка в тени из JS. никто не сможет 100% гарантировать его загрузки и некеширование.

Елистратов:
T.R.O.N, это понятно и тема недавно была..Но почему если сделать поиск в этом же окне все в норме, а вот преходы по ссылкам на поиск показывают такую фигню?

Как именно яша принимает решение о кодировке, - сказать немогу. Можно взять снифер и посмотреть. Могу дать предположения. Новое и старое окно где-то дает разную информацию в заголовке запроса:

1. JS ставит временный кук, который анализируется яшей (при первом входе кука нет)

2. По полу Referer

3. По информации сессии, которая откывается на серваке.

4. Инфа берется их поля USER-AGENT, но реакция появляется тольок после пострного входа.

И еще много чего. Ведь там программеров много.

И еще, скрипт, генерирующий страницу, получает данные из Perl (для которого UTF - это ад), C - здесь проще. + фронт сервера (ведь самое грамотное, создавать сессию, а потом юзера кидать на другой сервак.)

Елистратов,

так выглядит UTF при декодировании по WIN2151. Сменой кодировки броузера это не лечится. На стороне сервака идет декодирование, с неверным указанием энкодера источника.

Видимо яша хочет отдавать серп в кодировке, которую точно понимает (хочет) юзер.

SeoTron:
UTF-8 просто является универсальной кодировкой, например для unix систем используется,

очень улюбнуло....

выбы еще сказали, что она универсальна, потому, что на мобилах (WAP) она юзается...

Если говорить по сути, штука очень универсальная (UTF-8) а значит не удобная и грамоздкая. Яша всегда пользовал базы в KOI-8r(u), как наиболее удобные и компактные. Возможно, с вводом новых мощностей, будет пытаться перейти на что-то более монстральное, хотя при этом придется переписать всех ботов. Наверное и качу роботв базы тоже....

extreem,

тормоза связаны с с тем, что PPB, и другие бесполезные штуки, просто кешируют значения, дабы постоянно не дергать самого яшу (кеш живет 1-2 недели)

Значения они берут с яндекс-бара, а он сам, как правило, на недельку тормозит от апа каталога.

Вот вам и задержка

Всего: 4849