Новый нейротопик

sidorka
На сайте с 17.08.2012
Offline
211
#251

AESCBC192, у меня выборка из серпа топ-доменов по 400к ключам и данные аналитики к ним. Применяю для поиска дропов потом. На вход параметры - на выходе брать-не брать.

Математическое решение у меня есть, я писал выше.

Дешевые домены для дорвеев и не только - от 55р (https://goo.gl/Wtnwqp)
AESCBC192
На сайте с 11.06.2016
Offline
51
#252

В выборку бэдов намешай процентов 90, на одних гуд ты расходимый ряд получишь, он все пропускать будет, нужно граничное множество. А какое количество входных параметров, число входов нейронки? Сколько слоев берешь? И что за либа?

sidorka
На сайте с 17.08.2012
Offline
211
#253

AESCBC192, https://github.com/fragsalat/neural-network-bpn-php 4 входа, пробовал 5-8 внутренних слоев, 2 выхода - да-нет.

Где же мне их взять те бэды? Разве что свои дорвеи неудачные туда запихнуть, но этого мало.

Т.е. без отрицательного обучения сетка бесполезна?

E
На сайте с 17.02.2008
Offline
191
#254
vastmanager:
Если дорген не серверный, то все эти кучи страниц надо будет как-то загружать на хост.

ЛОЛ. 🤣

Выбираю прокси здесь: https://goo.su/zUub4. Хотите купить и Вы?
AESCBC192
На сайте с 11.06.2016
Offline
51
#255

ненене, 4 входа это вообще не нейронка, 128 хотябы, 5-8 на 4 входа нонсенс, бери 3 и пробуй 128 на 3 в примере с хабра есть конфигурация трёхслойки нормальная, я беру кратность как по модулю 2 в степени и слои от 3х и более.

На бэды можно любой бредоген загнать но лучше напарсить, нейронка множества обрабатывает, то есть представь плоскость, как озеро, в нем остров - это гуды, а вокруг граничный слой без него нейронка не выделит критерий границ.

Можно детализацией попроблвтаь обойти отсутсвие бэдов но подход будет ближе к точному вхождению, это снимет число слоев и превратит нейронку в жесткое уравнение, то есть обычный компаратор.

Возьми libfann 2.2.1 это что ты взял - костыль какой-то, FANN ставится не без ругательных идеоматических выражений но яб лучше на ней делал, тем более она на C++ с интерфейсом под PHP, этот как понял на php написан весь, это сокорость никакая, потому ты и с 4мя входами мучаешься, ставь нормальную либу и делай нейронку как на хабре под распознавание языков, не хватает данных на входы - заложи 64 бита на название, дальше параметры раскидай на осталньые, может интересные корелляции с названиями и домензонами найдешь, но 4 входа это не дело вообще, смысла нет.

Вообще если нейрока начинает гнать и выдавать один гуд - кидай всё в бэды и учи ее по шагам, вручную чтобы точно гуд на вход, да на выход, иначе решето а не нейронка получится.

---------- Добавлено 04.02.2017 в 13:08 ----------

И генерировтаь текст нейронкой можно но не так как там с букв на трёхслойка грели видяху часами. Это идиотизм клинический. Берется предложение или текст и разбирается скриптом на морфограмматический корпус, этот корпус в матрицу и на вход нейронки, этой нейронкой прасятся тексты по теме и с мозаики на каркас набирается новая масса под тоже содержание. Это анриально сложно реализовать но по-другому как-то использовать нейронки в тектогенерации..., да вы видяхи попалите)) я угарал когда эксперимент увидел и текст, 3 или 4 года назад таким страдал, положил видяху дорогую.

sidorka
На сайте с 17.08.2012
Offline
211
#256

AESCBC192, ерунда какая-то выходит - на обучение придется потратить намного больше времени и усилий, чем на простой статистический анализ. Значит, для указанного примера нейронка не годится.

---------- Добавлено 04.02.2017 в 14:14 ----------

extruder, vastmanager в чем-то прав - для больших объемов его утверждение справедливо - попробуй загрузи хотя бы 100 гиг такого говна на сервер. Даже если одним архивом - распаковывать будет долго, а если мелкими файлами - лучше сразу застрелиться.

AESCBC192
На сайте с 11.06.2016
Offline
51
#257

sidorka, кстати да, нонсенс вообще, если поисковый фильтр делать то можно попробовать как я педложил, смысл будет, и ранжирование... да, как раз ранжирование совей пске пожалуй так и сделаю.

Есть смысл например котировки прогнать через нейронку или текст поучить делать, но текст оочень сложно, все думают по буквам нужно брать и учить, не...)) придется пронумеровать весь словарь и сдалать с него матрицу, дальше описывать предложение векторами на этой матрице и уже по ней отступами от точек получать замены, вобщем я сам думаю как это реализовать попроще.

---------- Добавлено 04.02.2017 в 13:17 ----------

AESCBC192:
100 гиг

да зачем это вообще, грузить что-то на сервер, или архивом или базой, а лучше первые 40 страниц потом бот бегает по сетке докидывет страниц по крону. Грузить все за раз канеш тяжело.

---------- Добавлено 04.02.2017 в 13:20 ----------

что касается динамики. это я считаю вообще идиотизм клинический. ну кто пишет такие системы на PHP, распределенная система на пхп это угар, такое пишут на яве или плюсах, то что понаписывали в 7 пыхе с тестами сравнительными с питоном по сокетам это ни о чем не говрит, это непроизводительный язык он создан чтобы делать мало и средненагруженные сайты, уже хайлод на ASP или на C вообще пшут или яве, а тут кластер сайтов, это пролет на серваках, экономически безсмысленное решение.

exarh
На сайте с 28.03.2010
Offline
503
#258
sidorka:
у меня выборка из серпа топ-доменов по 400к ключам и данные аналитики к ним. Применяю для поиска дропов потом. На вход параметры - на выходе брать-не брать.

Вот тут я понял, попячен полностью((

Монетизируй (https://publishers.propellerads.com/#/pub/auth/signUp?ref_id=tnE) свой сайт с выгодой
AESCBC192
На сайте с 11.06.2016
Offline
51
#259

Читаю предыдущий и этот топик, вопросы про бэкграунд, оффтоп всякий, переходы на личноти с попытками поддеть, вам интерено не нищеброд ли я) этош дикий "зашквар" (или как там у вас в этом слэнге называется) у нищеброда крутой софт покупать да? ну развели вы классовую ненавить по дефолту и трамбовку за бэд бэкграунд, аля рожденный ползать летать не сможет, вобщем адептам этого тренда типа сытый конному не пеший и без кайена плохой программист хоть напиши систему рулежа звездолетом - продавать не буду)) продам нище@@бам таким же, пусть высадаят вас с выдачи и обанкротят нахер, сдавайте свои кайены на металлолом кароче.

_Snake_
На сайте с 06.12.2010
Offline
151
#260
sidorka:
AESCBC192, у меня выборка из серпа топ-доменов по 400к ключам и данные аналитики к ним. Применяю для поиска дропов потом. На вход параметры - на выходе брать-не брать.

Математическое решение у меня есть, я писал выше.

Может попробовать обучить на основе рейтингов LI или Alexa? Или искать где-то открытые счётчики с посещениями.

Парсиш рейтинг по какой-то тематике. Выбираешь отсечку до которой считаешь домены хорошие, после которой домены плохие. Собираешь для этих доменов свои 5 параметров и обучаешь.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий