Формулы ранжирования и Матрикскэт

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
7642

Давайте я коротко расскажу про формулы и алгоритмы. Просто навеяло соседним топиком.

Когда-то, лет 7 назад, небольшая группа внутри Тыдекса обсуждала, что бы такое показать оптимизаторам на очередной конференции.

"Давайте покажем им, как работает Матрикскэт", — предложил главный специалист, известный как ГрустныйОгород. — "дадим каждому по огурцу и листочек бумаги, ты же, Шир — обратился он к главному по впариванию, — можешь в Ворде смоделировать машинное обучение?"

"А давайте им покажем настоящую формулу, — предложил старый перебежчик, известный как БледноЧерный. — пустим на экраны настоящую формулу и еще одну камеру поставим, чтобы потом поржать с тех, кто её записать попытается?"

Победило гуманное предложение и каждый участник конференции получил по огурцу. А могли бы и поржать.

Так вот, про машинное обучение. Сколько не говори, а все равно народ будет надеяться на инсайды.

Формула ранжирования — это десятки тысяч строк кода, сгенерированного машиной на языке C.

При этом все коэффициенты к формуле лежат в кучке массивов, а все данные, к которым эта формула применяется — лежат примерно в 5 тысячах серверов. И формулы бывают разные. А бассейн резиновый.

Вы все равно не поверите, но я еще чего-нибудь расскажу :).

<!--WEB-->
На сайте с 25.01.2009
Offline
516
#1

Познавательно. ;)

Нижегородцеву топик не показывайте.

Проверяю позиции сайта в сервисе Серпхант ( https://serphunt.ru ) – быстро, качественно, доступно! Почему я не всем отвечаю ( )
Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#2

Who is Undercity-цев?

AE
На сайте с 28.08.2007
Offline
121
#3

Теперь у них одна формула - Чем больше хаоса, тем выше прибыль.

Сегодня 50% апнули и половина вебмастеров пошли свои сайты улучшать, выпытывать секреты у тех кого не коснулось.

В следующий раз апнут оставшиеся 50% и роли поменяются.

Узнай больше о Coca-Cola (https://www.coca-cola.ru/product?ref=17)
Z0
На сайте с 03.09.2009
Offline
756
#4
Gray:
Who is Undercity-цев?

Фанат яндекса и всего с ним связанного :) Он обычно тут тусуется:

/ru/forum/967827 🍿

P
На сайте с 26.04.2010
Offline
349
#5
Gray:
все равно народ будет надеяться на инсайды.
Формула ранжирования — это десятки тысяч строк кода, сгенерированного машиной на языке C.
При этом все коэффициенты к формуле лежат в кучке массивов, а все данные, к которым эта формула применяется — лежат примерно в 5 тысячах серверов. И формулы бывают разные. А бассейн резиновый.

Хотите сказать, что из-за наличия множества переменных, большого объема кода, который человеческий мозг уже не может проанализировать целостно, нельзя предсказать результат? А зачем его предсказывать, если он стоит задачей.

Представим, что есть 100 коэф.массива и 10 формул. Мы можем менять значения коэф и вносить небольшие изменения в формулы. При этом на вводе мы не знаем, что получим в результате. По-сути дергаем за рычажки черный ящик, а как оно все там влияет и работает сказать не можем.

Однако методом тыка, перебирая множество вариантов, можем найти при каком раскладе получаем результат наиболее близкий к желаемому. При этом данные на 5 тыс. серверах используются как материал, на котором производится так называемое "обучение". Можно загружать данные определенного типа/сайтов и смотреть какие коэффициенты наиболее хороши в этом случае. Потом загружаем другие данные и для них подбираем коэффициенты.

Так что если под инсадом понимать, что они хотят получить в результате, то такой инсайд имеет право на существование. А вот конкретно сказать, что надо сделать на сайте, чтобы он однозначно попал в топ, сказать сложно.

Devvver
На сайте с 02.07.2008
Online
662
#6

А можно о "задвижении автосалонов" рассказать?

Мой блог. Все о создании сайтов,Seo и СДЛ ( https://devvver.ru/ ) Мой SEO телеграм канал https://t.me/seobloggers
Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#7

Devvver, я, честно сказать, плохо помню те обсуждения. В смысле, обсуждения на роеме и здесь, сами обсуждения во внутреннем багтрекере я точно не читал.

Но оценку денег, конечно, упускать было нельзя. Причем, насколько я помню, ситуация могла выглядеть двояко. С одной стороны, весь отдел разработки Директа мог ходить довольным, когда небольшим изменением цвета шрифта спецразмещения удавалось увеличить на пару процентов CTR и заработать десятки тысяч долларов в неделю.

С другой, этот же отдел в лице Жени Ломизе мог придти с мрачным видом и рассказать Поиску, что они бракоделы и из-за них клиентам непредвиденно скликали бюджеты.

Если вам интересна методика экспериментов в Поиске Яндекса, то я могу рассказать — там нет особых секретов. Правда, видимо, стоит начинать не с самих экспериментов, а с проверки, что вы знаете про pfound, например.

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#8
plab:
При этом данные на 5 тыс. серверах используются как материал

Да нет, вы не поняли. 5 тысяч серверов — это примерный размер кластера. Это уже промышленный поиск, после всех стадий обучения и прочего.

[Удален]
#9
Gray:
Формула ранжирования — это десятки тысяч строк кода, сгенерированного машиной на языке C.
При этом все коэффициенты к формуле лежат в кучке массивов, а все данные, к которым эта формула применяется — лежат примерно в 5 тысячах серверов. И формулы бывают разные. А бассейн резиновый.

Несмотря на все эти сложности, многим сайтам удается держаться в топе годами, десятилетиями практически. У этих сеошников есть опыт воздействия на главные факторы ранжирования, интуиция, ну и сайты сделаны по уму.

Gray:
небольшая группа внутри Тыдекса обсуждала, что бы такое показать оптимизаторам на очередной конференции

Обида на Яндекс сквозит, но это другая история :)

SmileP
На сайте с 18.02.2010
Offline
386
#10
Gray:
pfound

Есть такая метрика. Это все что я знаю. Применяется она или нет - незнаю)

Ну и если, что грубо говоря отдел директа победил отдел поиска..

там и метрики удовлетворения качеством поиска не так важны(

Но это все теории.

Если бы они публиковали pfound.. то были бы споры- меряют они его или рисуют.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий