AESCBC192

AESCBC192
Рейтинг
51
Регистрация
11.06.2016

К слову, возможные сферы применения несложной нейронки, на котрых можно попрактиковаться с той же libfann : простейший спамфильтр для форума или блога, всего на 2 критерия: первый двольно специфический коннект если хронометрировать, второй критерий - само тело сообщения, его статистические характеристики, семантика и всречаемость, это не значит что нужно как-то семантизировать блок текста, его просто нужно грамонто подать на вход и обучить по схеме повторных предположений с фильтром неверных попыток, в обученном виде такая сеть весит немного и отрабатывает довольно быстро, можно сразу банить по маске коннекта: IP, юзереагент, другие параметры, учитывая что сама библиотека на C++ с интерфейсом под php большой нагрузки на сервер он создвать не должен. Это и есть простейший поисковый фильтр, заодно поймете как банятся сайты, как это обходить, далее из потока процесс можно сделать накопительным, сделать сеть сайтов и заниматься другими проектами.

---------- Добавлено 23.01.2017 в 02:19 ----------

Додик, vastmanager, любезности в личке или отдельный топик, ок.

Чтобы установить libfann придется перечитать оновную часть сатей из выдачи по её установке (+ насколько помню, рабочие материалы все на английском), перебрать make файлы вручную, докачивать промежуточные либы, вобщем придется повозиться (2.2.1, насколько помню, устанавливется на последние дистры, предыдущие установить не получилось), править php.ini, много чего вручную дописывать придётся. Рабочие примеры с этой либой на распознавание есть на хабре, есть экзампл, идущий в комплекте с самой библиотекой, в ней не так много функцй, основная часть работы - это подбор конфигурации и обучение.

libfann 2.2.1

По рапознаванию - трехслойная сеть собратной связью. Есть либы специальные с удобными интерфейсами, причем все это открыто, распознать изображения печатных символов не составляет сложности, но нужно найти оптимальноее соотношение числа входов и слоев нейронки, далее обучить, например методом приближающихся предположений с отсевом. Самое сложное в нейронке - подбор архитектуры и обучение, на графике по архитектуре лучше смотреть в сторону структуры зрительнго тракта, можно найти информацию сколько слоев в зрительной коре и как организована сетчатка и...

LandsKnight:
Хоть анализировать != генерить, но чтобы сгенерить, надо таки сначала правильно проанализировать

Да, алго генерации это дополненый алго поиска. Чуть не спалил технологию...)) Ны Вы на правильном пути, дам подсказку - морфозамена ломает содержательный фрейм, нужна семантическя замена, а без нейро это нереализуемо.

autodidact, простейший php скрипт или на другом ЯП под экспорт в любую устраивающую по функционалу CMS.

PS причем все компоненты для экспорта в популярные CMS легко гуглятся, поиграть пару часов в конструктор и софт готов.

exarh:
Религия мешает сюда кусок текста запостить?

я потом как нить расскажу что мешает. не техчасть вообще и не про форумные отношения тоже. хочешь - чиркани дам скрин.

bolyk:
Ну естественно, тайтл не может быть критерием, но как один из них - это 100500%

Как и все нейронки с учителем(а это 100 пудово) матрикснету подается на вход куча информации, и параметры тайтла, считаю и длину и наличие ключей и т.д.

Там все не так сложно: есть топ 20-100, хотя я склонен где к Топ 20 судя по Ципфу, и процент похожести вашего сайта на этот топ.
Яндекс с помощью асессоров(в комм темах - вручную, в мусоре(довнлоад, например) - автоматом, используя старый добрый пейджд ранк, ну как вариант) обучает свою нейронку "матрикснет" отделять Хорошие и белые сайты, от Доров и Прочего говна. Это очень легко делать даже для миллионов ключей, так как их легко кластеризовать по Темам на таких-то мощностях.

Сейчас его научили это делать при первом скане сайта, чтобы не пихать говно в Выдачу, ибо скорость ее роста просто эпическая, никаких краулеров не хватит, и Я и Г это поняли.

Вот и все.

Наша с вами задача попасть в этот допустимый %. Все. И пох ему на наличие у вас нейронки для генерирования белого контента.

AESCBC192, большая просьба, просто покажите 10 сайтов на вашем контенте. И если люди увидят что они сидят, и с трафом - Вам респект и все бабки.

Ок. Так взвесил - искуссво не должно быть в забвении)) Вчера походу магнитные бури были, сорьте кто попал под горячую руку, хт впринц любому бы уже надоело, но... искусство сейчас все под фреймом, кому инересно стукнитесь в аську покажу скринами все з замалевкой доменов, не охота топик в тумбокрутку превращать пикчами.

Вам то это зачем? Где логика? Давайте пожалуй оставим тему моей разработки в покое, так как конкретно в данном топике речь идет о возможных причинах бана сайтов и как вариант предполагаемом введении новых алгоритмов ПС.

не... тайтл это не критерий, там другое совершенно, расписать что делает нейронка словесно весьма проблематично, но у нее не совсем линейный алгоритм срабатываний.

Всего: 704