G00DMAN

G00DMAN
Рейтинг
122
Регистрация
19.04.2008

Коллеги, прошу прощения за то, что вчера соскочил с ветки в самое неподходящее время. :)

Без меня вроде все более-менее разобрали уже.

Я только хотел отметить свой косяк в обсуждении - дерево я принял не за дерево построения функции hk, а за дерево выбора функции hk, тут не последнюю роль сыграл английский язык, т.к. под decision tree обычно имеется ввиду дерево принятия решений, т.е. по сути выбор решения из множества альтернатив, вот я и купился. Бегло просмотрел и в статьи Фридмана сразу полез копать (а у него выбираются простые функции из заданного множества). Хотя на объяснялку в моей статье про Снежинск эти никак не влияет.

:)

Поздравляю! :)

юни:
А почему? Как добились? "Несколько тысяч параметров" немного... обескураживают.

Для такого вида функций придуман специальный жадный алгоритм, он быстро считает.

wolf:
Хм... То есть считаете, что вид функций от f i-тых задан априори? Вот так вот, для всех нескольких тысяч f i-тых? И нужно только найти коэффициенты при них? :)

Да. Причем коэффициенты по жадному алгоритму находятся быстро. А дальше сравнивается полученная релевантность с "истинной", и, если погрешность большая, то можно увеличить количество функций/изменить набор функций/увеличить обучающую выборку/изменить "истинные" релевантности. В целом метод вполне рабочий, кстати.

Функции выбираются так, чтобы вклад каждой в общую формулу получился не очень большим, возможно есть даже автоматизация процесса отбора функций по критерию "малый вклад". Т.е. например f1(q,d)=a1*TF(q,d) уже не покатит, если судить по моим исследованиям.

petruxa:
Ну, я имел ввиду то, что у них поток клиентов есть, 20%-25% их которых, допустим, выйдут - на них и будут жить)
А частникам, вроде меня, тяжело придется. Мы, выходит, теряем то единственное преимущество перед крупными компаниями, которое заключается в реально кропотливой работе над сайтом и его продвижением, той, которую почти невозможно себе позволить при потоковой работе на сотню и больше клиентов.
А судя по тому, что видно в буках сейчас, никакая кропотливая работа уже не роляет, по большому счету.

20% я написал для примера, на самом деле может и намного больше получится, это как повезет. :)

Опять же - буки пока сыроваты, посмотрим, что будет через месяц в выдаче.

petruxa:
А вот здесь вы что имели виду?:)

Я имел ввиду, что оптимизатор может сколько угодно считать, что рулит тематичность или что-то еще. На выдаче его методы могут отразиться достаточно произвольным образом. :)

G00DMAN добавил 16.11.2009 в 16:34

wolf:
Почитал. Речь идет только о подборе коэффициентов. А вид функций откуда, по-Вашему, берут? ;)

В Яндексе есть сильные и креативные математики, для них выбор таких функций наверное очевиден. Ну или пробуют разные наборы, экспериментируют пока. Считается-то быстро.

drg:
G00DMAN,
F = 3:14*log7(f9(q; d)) + ef66(q;d) + …
- это неудачный пример, в этой форуле нету смысла

Этот пример взят из презентации Яндекса. И он-то как раз очень удачный, я же писал, что у большинства слагаемых формулы ранжирования логического смысла нет, в том и фишка. :D

G00DMAN добавил 16.11.2009 в 15:58

Джонни Депп:
Искал размеры формата A5 и вот что выдали буки в ТОП-1 :
http://buki.yandex.ru/yandsearch?text=A5&rpt=rad&lr=1

Довольно любопытно.

а хочешь жни, а хочешь куй,

искал A5 - получишь... вики!

:D

G00DMAN добавил 16.11.2009 в 16:02

seolink74:
Вот и сейчас 1000 параметров оставили эти сайты в топе...так что на некоторые сайты алгоритм не влияет?

Не все в топе. По сео-логике бюджет+опыт оптимизатора должны рулить, но в буках пока что это не всегда так. ;)

seolink74:
Релевантный документ на качественном сайте с ссылками с качественных и тематических сайтов.

Проблемы начинаются, когда релевантных документов на качественных сайтах больше десяти. :)

petruxa:
Да, весело-весело) Игра в рулетку, по сути. Т.е. рандом для оптимизаторов. Вопрос в том, что делать отдельным вебмастерам которые сидят и кропотливо занимаются относительно небольшим кол-во сайтов? Выходит что им, если не повезет, будет нечего делать, а в плюсе будут крупные компании с 100-1000 клиентов, которые выиграют за счет "больших чисел". Так?

А с чего Вы взяли, что большие компании выиграют? У кого из "больших" есть реальный научный отдел? Судя по трудам РОМИП - нет таких. :)

petruxa:
Не лениво, Гудмэн, прочитал. Интересно, спасибо. Но только что же, получается в выдаче по-большому счету рандом будет что ли?? Если отдельные параметры входят в 1000 функций одновременно, да еще и коэффициенты меняются постоянно...по сути выходит что очень похоже на то.

Рандома в выдаче не будет, выдача получится достаточно стабильной. Рандом будет в результатах нашей деятельности, т.е. возьмете 10 проектов, а в топ из них выйдет только два, например.

petruxa:
Конец оптимизации или..?

Ну если два из десяти все же выйдут в топ, то почему конец? :D

mhz:
К вам на работу никто не требуется? :D

mhz, да вроде нет, разве что какой-нить монстр программизма для автоматизации потокового сео, это можно было бы обсудить. :)

Я тут написал немного букв про Снежинск. Можно почитать, если не лениво. :)

Intelis:
Дело не в том, как привычнее, а как логичнее, опираясь на общеизвестные факторы (или теперь там вмешалось что-то кардинально новое?), но решать это конечно не нам.

Вмешалось новое, ага.

Intelis:
Было бы смешно 🚬

А мне чета не очень. :D

Intelis:
Вероятно цель была сделать лучше, а пока, хоть и не в глобальном количестве, но примеры того, что стало хуже есть, а субъективно лучше не стало (был бы оригинальный список маркерных запросов оценки качества поиска, можно было бы получить интересней данные).

Ну есть же сервисы Ашманова, вполне приличные. По Ашманову на буках все не плохо.

Всего: 1960