- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи
И выявили более 7 млн подозрительных пользователей
Оксана Мамчуева
Аргументация всё солидней... :)
Ну ты делаешь какие-то забавные выводы, тебе говоришь - выводы не верные, но ты не врубаешься. Тебе более подробно все расписываешь - ты опять не врубаешься и снова гонишь свое. Я понимаю, что расписав тебе подробно алгоритмы вопрос может и решится (если ты наконец врубишься), но желания такого ни разу нет, технологий я раскрывать до конца не буду, т.к. там есть, чего прятать. :)
Походу, пустое жевание слова "халва" мало у кого вызывает ощущение сладости. Уж попросил бы своих кандидатов в доктора матчасть тебе подтянуть, что-ли... ;) Хотя это еще большой вопрос - нужно ли оно им. :)
Что за кандидаты в доктора?
Тогда давайте говорить прямо. Если бы у вас получилось создать модель "плохих ссылок", то вы бы получили набор факторов, который в 100% случаев приводил бы к выпадению ссылок. У вас же получилось 5-10-20 % (вы сами не говорите, сколько точно, но ясно, что немного), а значит в вашей модели очень много неучтенных факторов (в несколько раз больше, чем учтенных) и точность не выше того, что можно получить экспертной оценкой.
Точность на тестовой выборке была приемлемая. Естественно, я не могу Вам гарантировать, что она такой будет на реале и всегда. Что получится в итоге - покажет время, мне самому интересно. :)
Немного непонятно, как Вы выбирали сайты, которые не выпадут из индекса (для обучающей выборки, да и для тестовой тоже). Можно немного пояснить ?
Мы не выбирали сайты, которые выпадут. Мы считали вероятность выпадения страницы на сайте и много других параметров. На основании большой статистики сайта за длительное время его работы на бирже. Выбирались в первую очередь сайты, по которым статистических данных больше.
Изначально вы вели беседу о том, что определяете вероятность выпадания страниц на основе имеющихся у вас сайтов.
Да.
Одни сайты имели один полюс - ссылки будут выпадать, другие второй полюс - ссылки не будут выпадать.
Нет, ну вы сразу же себе противоречите. Мы прогнозируем вероятность, а не да/нет. Никаких полюсов не было, вы их сами придумали. :)
Нет, ну вы сразу же себе противоречите. Мы прогнозируем вероятность, а не да/нет. Никаких полюсов не было, вы их сами придумали
Но вы же не отрицаете, что использовали заранее отобранную выборку "плохих" и "хороших" сайтов для обучения?
Но вы же не отрицаете, что использовали заранее отобранную выборку "плохих" и "хороших" сайтов для обучения?
Не было разделения на две группы плохих и хороших. У каждого сайта был процент "плохости" (т.е. вероятность выпадания страниц), по нему сайты были разделены на несколько групп.
Dubovoj,А мутация яшиного алгоритма может при следующем витке сделать часть сайтов, которые были у него в одном полюсе - сайтами другого полюса. ... В этом вся суть мутации и невозможности обучить сеть на эту тему по двум имеющимся заранее выборкам.
ваша ошибка в том что вы думаете что яндекс произвольно убивает сайты АГС-ом, тогда да,
нельзя. Но на самом деле яндекс "убивает" "плохие" сайты, по крайней мере стремиться к этому,
и потому это не мутации, а направленные изменения (несколько зашумленные). Нейронная сеть
вполне может "понять" эту логику и обучиться ей, имитировать ее.
То что сайты на границе между "хорошо" и "плохо" будут "мерцать" имхо на обучение не окажет серьезного влияния.
И маловероятно что яндекс неожиданно станет считать значительный процент ГС как СДЛ, а СДЛ как ГС.
Пример с ПР как неучтеным параметром, х-м-м-м, но если, например, учитывается параметр типа число входящих ссылок то он частично нейтрализует отсутствие параметра ПР. Так что ничего страшного в том что не все параметры учтены не будет. Функциоальность сохранится на высоком уровне.
То что НС не дает ответа да или нет, имхо лукавство, в конечном итоге принимается решение об удалении сайта
из белого списка или нет, так что решение все равно двоичное.
Угу. Даже Сеопульт не выдержал, подтянулся к раздаче. Глядишь, сейчас тоже что-нибудь за математику задвинет
Сергей, Вы меня в свои "разборки - замеры" не втягивайте, пожалуйста, тем более связывая с Сеопультом ;)
Я всего лишь как сторонний не ангажированный наблюдатель мимо проходил и мнение со стороны озвучил ;)
Ну ты делаешь какие-то забавные выводы, тебе говоришь - выводы не верные, но ты не врубаешься. Тебе более подробно все расписываешь - ты опять не врубаешься и снова гонишь свое.
Про "более подробно" - это, скажем так, не совсем соотвествует действительности. Только туману напускается всё больше и щеки надуваются всё сильнее. Вот, наконец-то узнали, что оценкой в обучающей выборке является некая "вероятность выпадения страниц". Или опять неверная интерпретация тумана?
Про "более подробно" - это, скажем так, не совсем соотвествует действительности. Только туману напускается всё больше и щеки надуваются всё сильнее.
Ну ты опять начинаешь дешевый базар? :)
Такие заявления аргументировать нужно.
Вот, наконец-то узнали, что оценкой в обучающей выборке является некая "вероятность выпадения страниц". Или опять неверная интерпретация тумана?
Что ты подразумеваешь под "оценкой в обучающей выборке"? Расскажи, и мы тоже поймем, поняли ли вы хоть что-то, или опять не дошло.
э-э-э как-то непонятно, что собственно критикуется? отрицается само существование НС? отрицается возможность обучения НС? Отрицается возможность создания статистически репрезентативной выбоки в 10к сайтов? В чем вред или неверность "вероятность выпадения страниц"?
Что ты подразумеваешь под "оценкой в обучающей выборке"? Расскажи, и мы тоже поймем, поняли ли вы хоть что-то, или опять не дошло.
Под оценкой я понимаю параметр выборки, который вы, в общем-то, не можете объективно измерить. Поэтому и называете его вероятностью. Уж кто ее там оценивает - специально обученный человек (как асессор в Яндексе) или вы там себе правило какое-то эмпирическое придумали - не суть.
э-э-э как-то непонятно, что собственно критикуется? отрицается само существование НС? отрицается возможность обучения НС? Отрицается возможность создания статистически репрезентативной выбоки в 10к сайтов? В чем вред или неверность "вероятность выпадения страниц"?
beginerx, не, все гораздо забавнее. Вольф на протяжении всей ветки приписывает мне разнообразные мысли и действия, из серии "а тут гудман делал так", которые не имеют никакого отношения к действительности. После чего бодро их критикует. Заодно все это зафлуживается непонятными людьми и разбавляется ехидными комментами, типа "гудман слился", "гудман дует щеки", "гудман напускает туману". Ну ржака полная. :D
Побочный эффект у ветки печальный - Вольф наделал столько серьезных математических ляпов, что был временно вычеркнут из списка математиков. Надеюсь, что временно, головокружение от маркетинговых успехов иногда лечится.
G00DMAN добавил 30.08.2010 в 16:21
Под оценкой я понимаю параметр выборки, который вы, в общем-то, не можете объективно измерить. Поэтому и называете его вероятностью. Уж кто ее там оценивает - специально обученный человек (как асессор в Яндексе) или вы там себе правило какое-то эмпирическое придумали - не суть.
Что еще за параметр выборки? Не зная структуры выборки я могу навскидку назвать только один ее параметр - размер. Он легко считается, если что. :)
Если ты имеешь ввиду вероятность выпадания страниц на конкретном сайте, то да, такой параметр у сайтов в выборке есть, о чем уже неоднократно писалось. И при наличии длинной истории закупки с этого сайта он легко считается стат. методами. :)