Back Door Man

Back Door Man
Рейтинг
151
Регистрация
20.08.2003

Есть еще одна мелочь при заводе в мороз: заводится нужно с выжатым сцеплением, чтобы не заставлять акк ворочать еще и замерзшее масло в коробке.

Кста, вот вопрос. Мыть машину в мороз или нет? Я слегка опасаюсь за лакокрасочное покрытие и за замки, как бы не замерзли.

Оно меняется.
Вопрос: как Вы определили, что Ваша привязка не поменялась? Снаружи этого не видно, по урлу тоже. Да и привязка идет не к машине кластера, а к фронтальному веб-серверу, к которому Вас привяжет применяемое в Яндексе устройство балансировки нагрузки Cisco 7200 (может сейчас уже что-то посовременнее стоит - не знаю).

Скажем так, "не поменялось" - это предположение, основанное на том, что не поменялась выдача за период наблюдений (около получаса). Если период наблюдений увеличить - начнут примешиваться результаты "быстроробота". Охотно верю, что выдача меняется, но мне почему то не удалось этого увидеть.

Кроме того, не вижу смысла менять привязку. Я где-то встречал указание, что она идет по кукису (пользователь закрепляется за конкретной машиной), но за достоверность этой информации ручаться не буду.

Здесь имхо дело в другом.
Выдача бэклинков это не столь популярный запрос, чтоб его кэшировать отдельно, хотя может быть я что-то не так понимаю в технологии кеширования Яндекса..[skipped]

Сергей, изложенная Вами схема работы безусловно имеет право на существование. А вот как реально на деле происходит мы, видимо, без сотрудников Яндекса не угадаем :)

Определенное кеширование, все-таки существует, даже для таких редких запросов.

Провел небольшой эксперимент, запрос "link=somesite.ru"

После "прогона" нескольких страниц число ссылающихся сайтов стало неизменным. Открыл другой броузер, стер кукисы, выставил прокси - получил тот же самое количество беклинков. 🚬

В данном случае используется иная технология. Идет банальное кеширование.
Во время апдейта идет простой обсчет того кто за кем идет, и выведение этой информации в отдельную таблицу. Из которой уже она берется для выдачи на serp.

Spectre, с кешированием согласен.

Насчет хранения СЕРПа целиком в таблице - ну никак. :)

Я так думаю, что число запросы к поисковику подчиняются пресловутому "правилу 80/20", т.е. 20% уникальных запросов, покрывают 80% общего числа запросов. Вот эти 20% уместно кешировать, и делать для них СЕРПы прямо при апдейте. А остальные 80% запрашиваются слишком редко.

Yaroslav_Adv:
Первый раз слышу, честное слово... Правда?

Правда, но это было давно :) Сейчас может и с меньшим весом показать.

Т.е. получается, все что он нашел он в любом случае не покажет или все же покажет, но через большее кол-во времени?

Не покажет, покажет то, что посчитает нужным ;)

Плохие соседи на новом IP, или плохая история.

Для Большого Брата нет презумпции невиновности и он запросто банит целые сетки за спам

Seventh Son:
Вы знаете, я, конечно, не инсайдер Яндекса, но имхо хранить два раза одну и ту же информацию никто не станет. Скорее всего, что в одной таблице, где лежит страница, в одном из полей, просто перечислены индексы баз/таблиц/строк, где лежат бэки. Не более, ни менее.

Дык я тоже не инсайдер, но как у разработчика в прошлом немаленьких БД возникают некоторые решения 🚬

Даже если эти поля индексные, то пересчет их сумм на нескольких машинах займет нереально долгое время. Нереальное - в смысле пользователя, который ждет готовый SERP, тут нужны доли секунды.

Алгоритм с дублированием информации имеет два больших минуса:

1. Увеличение объема информации

2. Усложнение алгоритмов пересчета

Но они оба перевешиваются огромным жирным плюсом, который в случае с поисковой системой наиболее важен - быстродействием.

Дисковые массивы дешевеют, а время как всегда дорожает. :) Не грех и продублировать. :)

Seventh Son:
Забейте в строку поиска вот это #link="www.yandex.ru" и понажимайте Ctrl+F5 с десяток раз. Ежели бы все лежало на одной машине, то цифры бы не прыгали, так как операция выборки из БД выполнилась бы полностью. Это раз.

Порефрешил, подождал, еще порефрешил - не поменялось. Привязка меня как пользователя к конкретной машине кластера не поменялась.

ЗА что, если страничка будет ссылаться на какую-то еще. Что, продублируем в базе столько раз, сколько она на кого-то ссылается? Это два.

Ну да, а что Вас смущает? Три поля в таблице: id, кто ссылается, на кого ссылается. Просто как две копейки, и работает быстро

Кога начинаешь счелкать по номерам страниц в списке бэклинков - число уменьшается. Если бы вся выборка велась с одной машины - оно бы имхо не стало уменьшаться. Это три.

Имхо, это самый серьезный аргумент. Но и тут может быть своя фишка. При первоначальном запросе "link=" выдается некоторая заранее просчитанная сумма ссылок. Если пользователь тыкает на страницу 2, то идет уже выборка самих ссылок из базы и новым пересчетом их количества (забавно, но без апдейта предыдущего поля).

Pavel2005:
И какие изменения в выдаче могут быть?

Ну либо вверх, либо вниз :)

Sergey T:
Перенес сайт с российского хостинга на американский..... Как думаете, как скоро произойдут изменения в выдаче, связанные с изменением IP адреса сайта? Сразу или после очередной переиндексации?

Если и произойдут, то после переиндксации. Иначе как гугл узнает, что IP поменялся. :)

И будьте готовы к тому, что у ботов шибко длинный кеш DNS. Т.е. о смене IP он может узнать нескоро.

произойдут изменения

Произойти могут, но не обязательно

Ссылки можно "не учесть" (игнорировать, пессимизировать за них) не только по возрасту. Вот и получится каша... в голове... :).

Поставили одинаковых ссылок, а все списали на "песочницу" по ссылкам

Сергей, скорее всего (практически уверен), беклинки выделяются как отдельные единицы информации. Т.е. существуют в базе дважды(как минимум) - как страницы сами по себе, и как указание того, что ссылаются на какую то страницу. Никто не спорит что это усложняет систему, но таким образом достигается увеличение быстродействия за счет некоторой избыточности информации.

Мои аргументы просты. Хранение беков на страницу Х на одной машине существенно увеличивает быстродействие:

а) при пересчете вИЦ, тИЦ, ссылочного ранжирования, наложения фильтров

б) при выдаче по запросу Link=www.site.com

Лампой можно только дизельный движок греть. И то, лучше у трактора, а не у легковушки :)

Есть еще хорошая штука - каталитический нагреватель. Бензин сгорает в процессе химической реакции и греет картер снизу, никакого открытого огня. Но в продаже не видел - только самоделки.

Когда ездил на отечественных машинках юзал самый надежный способ - акк на ночь домой.

Всего: 1576