Папа, не мешай работать!
Папа, постом выше и еще выше, я написал, что не собираюсь получать все эти исходные данные, поскольку это бред сивой кобылы, равно как и предположение о том, что я их собираюсь получать.
Товарищ dlyanachalas, ваше "выведение на чистую воду" становится напряжным. Не знаю, как назвать это в терминах Луркморе, но если покопаться, что нибудь да вылезет.
Я в топике ничего не обещал, изложил свою диспозицию. Если кому то мои посты кажутся пустопорожними, мне насрать.
Я не собираюсь вычислять методологию формирования тысяч параметров Яндекса, и "функцию", которую они постоянно "оптимизируют".
Я не знаю, кто такой г-н Снежинский, "ересь" предположил на основе свои наблюдений и логики.
Тем не менее, если кто может ответить на мои вопросы или дать соотв. ссылки, было бы отлично.
Ну чего вы ко мне пристали?
Я уже несколько раз объяснил, что сам решить задачу, по всей видимости, не способен, но есть и другие варианты.
Такой принципиальный момент, который никто не понял, я не собираюсь строить существующую ранжирующую функцию, т.к., если коротко, это бесмысленно.
Теперь, у меня есть вопрос, возможно кто-нибудь знает ответ :)
Ассесоры выдают оценки rel(q, d) по паре q-запрос, d-документ. В трех местах я встретил разные данные: из отрезка [0;1], числа от 0 до 5 и третий вариант, числа от 0 до 4. В принципе, суть одна, второй и третий варианты можно нормировать до первого, вопрос в том, можно ли ставить ограничение сверху на различное число оценок, равное 5?
Также, насколько мне известно, в машинном обучении, обучающая выборка задачи классификации, грубо говоря, бинарная. Возможно ли это с нашими rel(q, d)?
Ну и еще вопрос, возможно ли, что Яндекс метрика заменила ассесоров?
albega добавил 02.01.2010 в 19:32
Доказана в 95, за год-полтора до этого доказана с использованием недоказанной гипотезы или что то в этом роде :-)
Это уже называется давление. Зачем давить, если можно не давить?
Вобщем, что касается конкретики.
Не знаю, есть ли этот человек тут, на форуме, но, думаю, он один из лучших в области интернет-алгоритмов. Хозяйкам на заметку.
Попробую у него проконсультироваться на начальном этапе, хотя последнее общение - десятилетней давности.
Кстати, у него есть друг, специалист в области распознавания образов, что тоже относится к задачам классификации.
В ближайшие две недели я собираюсь ботать теорию и адаптировать ее под настоящий алгоритм Яндекса, пока по косвенным признакам. Для того, чтобы в дальнейшем выяснить, в каком "виде" алгоритм Яндекса применяет эту теорию.
Предварительный вывод: вот эта статья - пугалка для детей.
Цитата
Я просмотрел несколько задач с жадными функциями, там все намного проще, без диких экземпляров и вроде как даже с бинарными функциями (да/нет :))
Подготовлю свой более подробный вариант адаптации (основанный на теории и практических задачах) доклада Яндекса.
Не могу не ответить :)
Мне кажется, падения из топ10 в топ30-100 при последних сменах алгоритмов были связана с тем, что эти сайты, в свое время, продвинули в топы только частью параметров, за счет их многократного усиления. Также, думаю, что имеют место быть некоторые фильтры, поскольку если каждому сайту из топ-100 выставить вещественные числа, рейтинг, на основе функций ранжирования, то должна быть существенная разница между, скажем топ 10 и топ 50, следовательно, сильные падения связаны с насильным урезанием, а не с пересчетом.
Сожалею, но на вопрос не ответил.
Также, не говоря об общем, возможны успешные частности. Во многих задачах, главное отнюдь не фишиное решение, а процесс решения. Классический пример: упоминавшийся здесь ВТФ, который был сформулирован в нескольких строчках, доказывался лет 400 многими замечательными математиками всех поколений, в результате чего были открыты новые пласты математики, в этом и заключается ценность этой задаче, но не в конечном успешном доказательстве. Соотв., если пойти по "правильному" пути, могут открыться универсальные вещи (инструментарии анализа), применимые к любым алгоритмам.
Всем пока.
Показывать мне нечего.
На этапе постановки этой конкретной задачи я справлюсь, только, если вы не заметили, я говорил не только об этой задаче.
Конечно.
Понятия не имею, но имхо, сделали больше, чем "запуск бота в рунет от BDBD", о чем было сказано здесь.
Вольно или невольно, тема становится флудообразной, что вдобавок отвлекает, поэтому вынужден не посещать эту тему.
Напоследок, небольшое резюме топика.
Раз
Два (взято отсюда)
Привел в пример некоторый параметр ранжирования :) этих людей, возможно несущественный. Но по этому параметру ваш скромный слуга может себя вычислить не на порядок ниже. Не говоря уже о "других", трижды упомянутых.
Для решения (или процесса решения) предварительно озвученных задач, безусловно должны быть задействованы другие параметры. Но, по моему мнению, эти параметры - больше дело техники и организации.
С маленьким опытом в этой области, все же предположу, что даже самые серьезные оптимизаторские компании не занимаются "моделированием алгоримов Яндекса" на уровне, выше, чем количественные оценки "параметров". Хотя, казалось бы, "чуть более чем" два человека (с необходимыми ТТХ) + инфрастуктура сделают все как надо.
Фишино, поскольку я никогда не занимался тем, чем занимаются (и долгое время) Раз и Два, что говорит об отсутствии даже базиса, но в течение разумного времени появится принципиальное понимание предмета и возможность ставить задачи.
Также, я оставляю возможность того, что был наивен до идиотства, время покажет.
Здравствуйте. Для пробы готов взять 1 млн.
А в чем, собственно, "полезность" и применимость этого вопроса? В том, что никто не может дать ответ?
Спасибо, с наступившим.
Вероятно потому, что два одинаковых сайта не могут стоят рядом в выдаче, т.к. склеятся :)
В общем и целом работа идет. Здесь, как человек вежливый, я пока отвечаю на поступающие вопросы, на основании имеющейся у меня информации на каждый момент времени.
Это вопрос?
Что касается понтов, я могу привлечь более лучших математиков, чем те, кто спроектировал Нигму.
Если опять поразмышлять, опытные оптимизаторы анализируют данные и делают выводы больше на своих системах сбора статистики, менее опытные применяют разные пульты и эффекторы, суть которых - парсинг + возможно, "формула". Как минимум, я хочу разработать наиболее правильные методики сбора данных и их обработки, а в иделае получить инструмент, в который можно загнать запрос, а он ответит детализированной стратегией продвижения этого запроса за разные периоды времени.
При этом там конечно будут не только "бюджет" и кнопка - автомат, но учет тех самых динамических факторов.