AESCBC192

AESCBC192
Рейтинг
51
Регистрация
11.06.2016

Lifemaster, вообщето брал места и доходил до международных олимп по многим из перчисленных направлений, возможно у меня нет ваших понтов и ужимок лакшерностоличных но это не значит что я некомпетентен как специалист.

Lifemaster:
укрепляй фрейм и все такое

сракатан свой укрепляй олень конченый

---------- Добавлено 04.02.2017 в 15:33 ----------

Ringozo:
о многоходовочка с эпическим концом окончанием

если человеку долго и упоро портить нервную систему то однажды будет срыв это очень простая комбинация без "многоходовочек".

exarh, каен есть? нищеебов травишь? по мне судя то травишь, так что иди ка ты со своей готовностью...

exarh:
вместо того что бы показать действующие примеры.

здесь я должен начать оправдываться за то что не успел нагенрить примеров и посмел поспать лишние 2 часа а не впахивал по 16 как обычно. не беси меня а.

---------- Добавлено 04.02.2017 в 14:32 ----------

J-ran, заметись с топика.

J-ran, что ты вдул перед этим? как крутой софт может делать гавно. иди покупай себе в дргуих местах кароч.

JungleBox, ну яш не за космос продавать собираюсь, демпинговать и высаживать себя на один картофан тоже не буду, баксов 250-400, но это за стабильный вариант, а не так как понабирают 100500 софтин по 100 баксов, одной шаблоны парсинга меняй, другую насттраивай три дня, для другой пачку геморроидальных свечей в комплект надо чтобы 3е суток шабы делать и ман читать...

Моей схеме не нужны апдейты, она будет работаь и через год и через два, просто запустил и софт рабоатет а не кричит там апдейт ему, на форум беги регулярку под гугл тащи или карауль тимлида проекта в трэде. Не апдейты будут мне пока не надоело)) но софт безотказый на это весь упор шел.

---------- Добавлено 04.02.2017 в 14:16 ----------

_Snake_:
Может попробовать обучить на основе рейтингов LI или Alexa? Или искать где-то открытые счётчики с посещениями.
Парсиш рейтинг по какой-то тематике. Выбираешь отсечку до которой считаешь домены хорошие, после которой домены плохие. Собираешь для этих доменов свои 5 параметров и обучаешь.

кстати нормальная схема, в графиках должна быть матрица какая-то с параметрами если ее оттуда вытянуть можно неплохой фильтр сделать.

Читаю предыдущий и этот топик, вопросы про бэкграунд, оффтоп всякий, переходы на личноти с попытками поддеть, вам интерено не нищеброд ли я) этош дикий "зашквар" (или как там у вас в этом слэнге называется) у нищеброда крутой софт покупать да? ну развели вы классовую ненавить по дефолту и трамбовку за бэд бэкграунд, аля рожденный ползать летать не сможет, вобщем адептам этого тренда типа сытый конному не пеший и без кайена плохой программист хоть напиши систему рулежа звездолетом - продавать не буду)) продам нище@@бам таким же, пусть высадаят вас с выдачи и обанкротят нахер, сдавайте свои кайены на металлолом кароче.

sidorka, кстати да, нонсенс вообще, если поисковый фильтр делать то можно попробовать как я педложил, смысл будет, и ранжирование... да, как раз ранжирование совей пске пожалуй так и сделаю.

Есть смысл например котировки прогнать через нейронку или текст поучить делать, но текст оочень сложно, все думают по буквам нужно брать и учить, не...)) придется пронумеровать весь словарь и сдалать с него матрицу, дальше описывать предложение векторами на этой матрице и уже по ней отступами от точек получать замены, вобщем я сам думаю как это реализовать попроще.

---------- Добавлено 04.02.2017 в 13:17 ----------

AESCBC192:
100 гиг

да зачем это вообще, грузить что-то на сервер, или архивом или базой, а лучше первые 40 страниц потом бот бегает по сетке докидывет страниц по крону. Грузить все за раз канеш тяжело.

---------- Добавлено 04.02.2017 в 13:20 ----------

что касается динамики. это я считаю вообще идиотизм клинический. ну кто пишет такие системы на PHP, распределенная система на пхп это угар, такое пишут на яве или плюсах, то что понаписывали в 7 пыхе с тестами сравнительными с питоном по сокетам это ни о чем не говрит, это непроизводительный язык он создан чтобы делать мало и средненагруженные сайты, уже хайлод на ASP или на C вообще пшут или яве, а тут кластер сайтов, это пролет на серваках, экономически безсмысленное решение.

ненене, 4 входа это вообще не нейронка, 128 хотябы, 5-8 на 4 входа нонсенс, бери 3 и пробуй 128 на 3 в примере с хабра есть конфигурация трёхслойки нормальная, я беру кратность как по модулю 2 в степени и слои от 3х и более.

На бэды можно любой бредоген загнать но лучше напарсить, нейронка множества обрабатывает, то есть представь плоскость, как озеро, в нем остров - это гуды, а вокруг граничный слой без него нейронка не выделит критерий границ.

Можно детализацией попроблвтаь обойти отсутсвие бэдов но подход будет ближе к точному вхождению, это снимет число слоев и превратит нейронку в жесткое уравнение, то есть обычный компаратор.

Возьми libfann 2.2.1 это что ты взял - костыль какой-то, FANN ставится не без ругательных идеоматических выражений но яб лучше на ней делал, тем более она на C++ с интерфейсом под PHP, этот как понял на php написан весь, это сокорость никакая, потому ты и с 4мя входами мучаешься, ставь нормальную либу и делай нейронку как на хабре под распознавание языков, не хватает данных на входы - заложи 64 бита на название, дальше параметры раскидай на осталньые, может интересные корелляции с названиями и домензонами найдешь, но 4 входа это не дело вообще, смысла нет.

Вообще если нейрока начинает гнать и выдавать один гуд - кидай всё в бэды и учи ее по шагам, вручную чтобы точно гуд на вход, да на выход, иначе решето а не нейронка получится.

---------- Добавлено 04.02.2017 в 13:08 ----------

И генерировтаь текст нейронкой можно но не так как там с букв на трёхслойка грели видяху часами. Это идиотизм клинический. Берется предложение или текст и разбирается скриптом на морфограмматический корпус, этот корпус в матрицу и на вход нейронки, этой нейронкой прасятся тексты по теме и с мозаики на каркас набирается новая масса под тоже содержание. Это анриально сложно реализовать но по-другому как-то использовать нейронки в тектогенерации..., да вы видяхи попалите)) я угарал когда эксперимент увидел и текст, 3 или 4 года назад таким страдал, положил видяху дорогую.

В выборку бэдов намешай процентов 90, на одних гуд ты расходимый ряд получишь, он все пропускать будет, нужно граничное множество. А какое количество входных параметров, число входов нейронки? Сколько слоев берешь? И что за либа?

А что ты распознавать пробуешь и каким методом обучаешь?

Нейронка на задачах средней и низкой сложности, то есть где меняется меньше 10 параметров системообразующих - это способ не перебирать вручную огромный массив данных в поисках зависимостей, тогда можно обработать корреляционный анализ нейронкой и дальше взять из нее функции зависимости одного парметра от другого, то есть корелляционные функции, а дальше их можно прописать статикой, гибкость снизится несколько но возрастет степень оптимизации. Можно добавить алгоритм отрый будет вытаскивать корреляции из матрицы нейронки, можно написать модуль апдейта котрый будет переучивать ее и доставать новые корелляции, направлений для оптимизации очень много.

При свертке на выходе получается набор правил работы с множествами, например какая констукция и какое количество раз может встречаться, или как количество срабатываний одного правила влияет на другой парметр (правила второго уровня), иными словами есть возможность "скомпиллировать" нейронку в набор четких правил по работе с множествами, это не значит что нужно обязательно компиллировать, но этот подход показывает что любой фильтр в том чиле те которыми софт обрабатывает текст можно представить в виде нейро и наоборот.

Для лучшего понимания темы можно изучить раздел математики Нечеткая логика (или логика нечетких множеств)

https://ru.wikipedia.org/wiki/%D0%9D%D0%B5%D1%87%D1%91%D1%82%D0%BA%D0%B0%D1%8F_%D0%BB%D0%BE%D0%B3%D0%B8%D0%BA%D0%B0

По сути нейронка это работа с нечеткими множествами, а каждый новый слой - это повышение уровня абстракции, примерно как в размышлениях человека.

-первый уровень - прямые кореляции между множествами

-второй уровень - корелляции между множествами состоящими из корелляций первого уровня.

итд.

То есть как в речи, есть слово, есть группа синонимы, есть семантическмие категории, есть специализирущие термины, дальше идет простройка по уровню технологий.

Сфер применения очень много от тремодинамики до анализа финансовых рынков.

Всего: 704