Экономия ресурсов не при чем, у Google их достаточно, в общем виде фильтр ПС - это нейронка, на вход которой подаются данные сгенерированные различными ГА, и если поколение банится, это означает что алгоритм генерации не проходит фильтр, а не проходит потому что не достаточно вариативен, отсюда вывод, если сайты банятся значит у алго их генерации недостаточно степеней подвижности для преодоления давления отбора, вот напрммер статьи на сайтах появляются все и сразу, а исчезать статьи могут? в типичной технологии - нет, повляются все сразу, а постепенно, а скачками, шаблон может смениться - нет, итд. Но в итоге дело даже не в этом, сайту нужно доказывать ПС что-то, а на это нужна статистика, на ее набор нужно время, бан = время на перезапись одного бита в базе - доли миллисекунды, а на получение позиций и трафика сколько нужно времени? У сайтов нет времени, а у ПС оно есть, отсюда вывод - варьироваться должн не только мезанизмы обхода фильтров но и сами источники трафика, если зависеть всегда от ПС - это проигрыш в итоге однозначно.
Пришел к интересной мысли: если воссоздать механизмы поисковых фильтров и подключить к ним ГА, генерирующий серию поколений алгоритмов, то можно отсеять наиболее жизнаспособные варианты генерации. То есть по сути я перевожу эксперимент по созданию и бану сайтов ПС на более короткий таймфрейм, там где при обычном подходе системе для накопления необходимой информации нужны годы создания сайтов и анализа причин их бана при моем подходе эти данные могут быть получены за один проход системы и время ограничено лишь производительностью аппаратной части и оптимизацией кода, что на данном этапе представляет основную задачу.---------- Добавлено 22.10.2016 в 14:12 ----------PS похоже генерация сайтов не самое оптимальное применение для технологий подобного уровня.
Neo00007, уже решил, там специфическая настройка мешала, не эта.---------- Добавлено 18.10.2016 в 22:28 ----------По отделению текста различных языков есть неплохой материал на хабре с примером по нейронкам. Можно обойтись без нейролиб, но для этого придется снять матрицы специфических процентов входений букв и слогов для кадого языка и по ним определять.
Кто подскажет как снять ограничение времени выполнения скрипта в ISP, set_time_limit(0) не помогает.
Ты завышаешь ценность своего мнения или ты можешь высказаться по нейронным сетям и ГА конструктивно в контексте создания контента?
Итальянский от английского - нейронка в помощь.
К слову морфовариантивный алгоритм - это праобраз ГА, + нейронка и немного еще кое чего и будет создавать смысловой контент, но углубляться в это в рамках потокового создания сайтов не вижу смысла + php будет слабоват для этих задач. Более того на таком принципе генерирует поведение мозг человека, генерация массы вариантов на основе базовых принципов с последующим выбором наилучшего варианта, на таком принципе построены современные реализации ИИ, но для сайтов это слишком, того что я привел в теме должно быть вполне достаточно.
исправил парсинг, теперь вытаскивает тонны текста даже по длинным низкочастотеым кеям.
Бэнчмарк - генерця небольшого лэнда, тест уже на сервере, потому быстрее чем предыдущий на локалхост через прокси.
smiler, обиды? скорее не всегда еть время наподдержание флейма, пишу в основном по изменениям в софте, ну а касательно времени разрабтки, тут нужно понимать что качественный продукт за неделю не пишется.
под пиар своих технологий лучше свою ветку заведи, не без сравнительных отступлений и конструктива по теме, но ты уже не первый раз прямо торгуешь свиоими скриптами в этой ветке, хотя она не продажная и я сам в ней ничем не торгую, а только пишу анонсы.
сейчас не скажу точно, но не 1 страницу точно. это непаблик алгоритм, новый эксперименталный, те что в основной версии работают быстрее, им не нужно столько текста.---------- Добавлено 16.10.2016 в 22:43 ----------Насчет тестов/проб и так далее, на тиражную версию, то есть не кастом а то что продается массово манибэк-гарантия неделя, то есть не понравится - можно вернуть, кота Шредингера в черном ящике давать не собираюсь, все прозрачно, предпродажные вопросы etc.