- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Хрнс, я с уважением отношусь к Вам
Искренне, спасибо.
в первом посте топика в Excel-файле в J-ячейках формула LN(B7+0.5), откуда берете "0.5", который складываете в логарифме с весом?
0,5 это за счет того, что я нашел интервал, размером в 1, ВНУТРИ которого реально проходит грань.
Скажем при весе в 10, первой идет страница 202, при весе 11 первой идет страница 203. Наиболее вероятное значение величины ступеньки это (10+11)/2, что я записываю как 10+0,5
Скажем при весе в 10, первой идет страница 202, при весе 11 первой идет страница 203. Наиболее вероятное значение величины ступеньки это (10+11)/2, что я записываю как 10+0,5
А что в M,S-ячейках? Что за величину дает отношение линеаризованного веса (с использованием корня из натурального логарифма веса) к разнице линеаризованных весов соседних ступенек? И как эти M,S-ячейки связаны с релевантностью, например, описанной Вами для текста как:
Р = (число вхождений ключевика) * sqrt(ln(вес)) / sqrt(число вхождений самого частого слова)
А что в M,S-ячейках? Что за величину дает отношение линеаризованного веса (с использованием корня из натурального логарифма веса) к разнице линеаризованных весов соседних ступенек?
M,S столбцы это чисто вычислительные, они дают возможность следить за тем идут ли ступеньки регулярно и позволяют сравнивать размеры ступенек для разных запросов и разных страниц (для наглядности). То, что при делении они при больших весах дают целые числа (можно считать число ступенек, если ступеньки идут друг за другом а не через 2-3-4-5 и тд.) весьма показательно. Время от времени там идут сбои (прогнозируемые, так как ВИЦы разные и наклон "лестниц" разный, он не может точно совпадать с отношением ширины ступени к ее высоте), целые числа сразу впечатляют. А когда отношение тошнот (ширины и высоты ступенек) оказывается частным от деления двух целых чисел, это тоже производит впечатление, когда вдруг ты догадываешься, что это за целые числа :)
Р = (число вхождений ключевика) * sqrt(ln(вес)) / sqrt(число вхождений самого частого слова)
Будем считать, что эту формулу (она была РАНЬШЕ в алгоритме), мы и проверяем сейчас.
Она отражала, например, антиспамовый коэффициент и модификацию tf степенной функцией со степенью меньшей 1 (а фактически степенью 1/2, как сейчас Вы могли видеть из файликов которые выложены) из работы Маслова, которую уже приводил Wolf: http://www.romip.narod.ru/romip2003/6_yandex-romip.pdf
Возьмите эту формулу для ключевика-самого частого слова, получится корень квадратный из этого самого частого числа: tf^0,5
Ваши посты очень содержательны, но времени приходится тратить на их разбор просто неадекватно много
Угу. Чтобы понять алгоритмы яндекса лучше изучать катрены Нострадамуса, где эти алгоритмы описаны более полно. Да и времени затратите меньше, чем на посты Хрнс.
Уважаемый ХРНС!
Премногое спасибо вам за ваши эксперименты – действительно очень полезно. Внимательно и с интересом читаю все ваши темы. Однако, как заметили старшие товарищи, действительно слишком много зашифрованных данных, которые приходится расшифровывать самому, что отнимает очень много времени.
Если вы намеренно ограничиваете информацию, допустим, чтобы ваши расчеты смог понять очень узкий круг посвященных, или по другим очевидным причинам, так и скажите – ребята, я не могу показать вам все, верьте мне на слово. Но ведь вы приглашаете к диалогу – «тот кто заинтересован понять что и как и почему разберется в файлике и подумает».
Я честно пытаюсь разобраться что к чему уже почти неделю – начальство в отпуске, появилось время – и не могу. Не могу по причине нехватки данных. Поэтому задаю законный вопрос – а почему вы не озаглавите столбцы? Почему бы вам не написать, что J=ln(b + 0,5), что K=sqrt(J), что L= K(i) – K(i+1), и т.д. ? Вы много пишете на форуме, думаю описать более-менее подробно суть эксперимента для вас не составит большого труда.
Если же вы подбрасываете нам головоломки намеренно – я бы сам не стал выкладывать на блюдечке для всех результаты эксперимента, над которым корпел неделю или больше – так и скажите – этот файл для любителей поломать голову, предупреждаю ребята.
Теперь конкретные вопросы. Объясните пожалуйста, по какому принципу вы отбираете числа (веса слов - @@@ и ###), т.е. колонку f – для своих запросов? Я не могу понять логики, но ведь не с потолка же вы их берете.
Мне кажется логично было бы сделать так – (для запроса слово1::вес1 | слово2::вес2) – стартуем с одинаковых весов, например с минимума - с единицы, начинаем повышать вес слова с менее релевантной страницы – допустим вес2, находим пороговое значение смены выдачи – фиксируем вес2 и начинаем уже увеличивать вес1, пока выдача опять не изменится, и т.д… до максимума.
У вас же явно по другому – как? И пожалуйста, напишите в файлике , откуда берутся J K L M … чтобы вас не спрашивали в топике «а что такое L» - если это конечно возможно.
Вы много пишете на форуме, думаю описать более-менее подробно суть эксперимента для вас не составит большого труда.
ВЫ неправы. Это тоже труд, причем наиболее время-затратный. А Вы знаете такую фразу: "нехватка времени"?
Теперь конкретные вопросы. Объясните пожалуйста, по какому принципу вы отбираете числа (веса слов - @@@ и ###), т.е. колонку f – для своих запросов? Я не могу понять логики, но ведь не с потолка же вы их берете.
Мне кажется логично было бы сделать так – (для запроса слово1::вес1 | слово2::вес2) – стартуем с одинаковых весов, например с минимума - с единицы, начинаем повышать вес слова с менее релевантной страницы – допустим вес2, находим пороговое значение смены выдачи – фиксируем вес2 и начинаем уже увеличивать вес1, пока выдача опять не изменится, и т.д… до максимума.
ткуда берутся J K L M … чтобы вас не спрашивали в топике «а что такое L» - если это конечно возможно.
jklm это формулы экселя , взятые от весов, найденных в эксперименте. Почему именно такие? Считайте, что мне так показалось удобным.
ХренРедькиНеСлаще, вот обьясните мне, плиз, и что с этого всего ? Что функция монотонно возрастающая, это, как уже говорил вольф, и так понятно. Дальше то что ? А так это опиум для народа...
ХренРедькиНеСлаще, вот обьясните мне, плиз, и что с этого всего ? Что функция монотонно возрастающая, это, как уже говорил вольф, и так понятно. Дальше то что ? А так это опиум для народа...
Первая опция опия для народа бесплатно :)
Кстати, а я только еще в начале пути :)
ВИЦы, доноры и больные, длина ссылок, число ссылок, оптимизация ссылок, "склейка" (гы-гы), разные тексты ссылок, одинаковые тексты, асимптотическое поведение линкатороподобных систем...
Впереди еще много серой работы для серых наших мышей. Или это уже никого не интересует, потому что Яндексоиды давно все это уже разжевали и раскрыли и всё давно всем известно??
Первая опция опия для народа бесплатно
Насколько я понимаю, ради второй опции (платной) всё и затевается. Чтобы пришел клиент, дал денег, сказал: "померяйте мне ВИЦ", получил ответ: "38 попугаев и одна ступенька Миныча, пардон, попугайское крылышко" и счастливый ушел восвояси. ;)
ХренРедькиНеСлаще, всем интерестно, продолжайте.