Я использую PCNTL, но можно эмулировать и другими способами. Вот где действительно есть проблема - утечка памяти из-за глупого gb, в 5.3 проблема должна быть решена, пока не тестил. Так что ПХП вполне подходит под эти задачи.
Кто воздражал против шаблонизатора - вам ещё не надоело в каждом шаблоне делать по 4 почти одинаковых файла index, category, page, map?
А со смарти я генерю доры любой структуры и сложности. Хоть сателлиты под сапу генери :)
Каждый любит свой дорген и считает его лучшим.
Меня не нужно убеждать, я не экономлю на спичках. Тут у нас не энтерпрайз. Но бывают случаи, когда увеличение производительности на секунду выигрывает часы времени. А стоит только добавить многопоточность, как скорость вырастает ~ в Х кол-во ядер, что тоже очень весомо.
Тем, что все паблик доргены - это лажа. Плохо масштабируются и показывают примерно такую же скорость генерации, но при этом весь код написан на дошкольном уровне 5 лет назад, а последние годы лишь исправляются баги, причём во время исправления - вносятся новые.
Аналог РБ пишется за неделю.
Я хочу сказать лишь одно - дорген - это лишь инструмент, чаще всего очень тупой, нужно думать своей головой и обязательно максимально автоматизировать весь процесс.
Не все хостинги поддерживают PHP, а залить 100500 файлов через PHP - садомазахизм. Смешно, да? :) Представляю как всеми любимый РБ зальёт 1000 доров в сутки ;)
DMI очень прост. Процесс генерации более удобен при минимуме настроек (по сравнению с РБ). Больше всего не хватает генерации категорий, это и многие другие мелочи подтолкнули меня к написанию своего доргена.
Приведу злободневную проблему: у меня есть 10 шаблонов и я хочу сгенерить на них 5 тематик доров, но как проставить ссылку на ТДС не клонируя шаблоны? Всё приходится делать через задницу.
И меня просто добивают некоторые мелочи: при сабмите хостов в задание - если оставить лишнюю пустую строку, то DMI выдаст ошибку. Если допустить ошибку в шаблоне, то получим ошибку питона и догадывайся сам что не так. Если у меня динамический IP - DMI постоянно теряет лицензию, приходится удалять её и ставить заново + как было замечено, недавно автор профачил домен с валидацией лицухи, пришлось прописать IP в hosts.
По алгоритму генерации текста: ключевик вставляется либо вначале строки либо вконце. При всей его морфологической генерации текста я ожидал что ключевики будут вставляться более умно.
Очень плохо скачиваются фотки (хотя у знакомого на ДМИ качаются нормуль).
Если при заливе задания посреди залива пропадёт интернет, считай придётся генерить всю пачку заново.
И пришлось сильно поднапрячься чтобы установить нужную версию питона и sqlite на ubuntu-сервер.
Вердикт: большинству дорген будет удобен и на нём генерить удобней, чем на РБ. Сам находит текстовки, выкачивает картинки, сам может собрать ключи. Быстро привыкаешь к мелким косякам, на это обычно не обращают внимания.
Setor добавил 30.07.2010 в 15:19
Расскажу про свой дорген (комплекс).
Дорген написан на PHP5.2, полностью ООП, включает в себя более 50 классов. Использует внешние библиотеки: Smarty для шаблонов, PHPmorphy для морфологии, Pclzip для архивации (залив и распаковка зипов по FTP), jspacker для упаковки javascrip редиректа и другие менее значимые библиотеки. Генерация заданий для файлзиллы, ссылок для хрума.
Всё автоматизировано, скорость генерации 30 секунд на 500 страниц. При всём обилии кода падение производительности по сравнению с тем же РБ минимально. И кто сказал что Smarty самый тормозной шаблонизатор? :) Зачем изобретать велосипед, сложные макросы, зачем учитывать вложенность блоков, если всё это уже написано.
Своя "кнопка бабло" на PHP. Говоришь ей сколько денег хочешь заработать и как быстро, остальное делает сама 🚬
Не знаю почему все так хвалят DMI, тоже на нём генерил (мало макросов) и на РБТ генерил, но слишком много ручной работы, пришлось всё автоматизировать.
А что вы хотите от молодого сайта в очень конкурентной тематике через 1-2 дня после индексации? Если бы это были откровенные ГС, я бы тут не позорился :) Траф по низкочастотке пойдёт через недельку, но вопрос в том, почему модератор не заходил на сайт - это его работа.
P.S. не надо так остро беспокоиться о качестве генерёного контента, это вам не доры на марковке. При закупке ссылок видно что в сапе очень много сайтов с генерёным бредотекстом, по этому я понимаю ваши эмоции :)
Смотрят, были преценденты, когда из-за небольшого скопипатенного абзаца весь сайт кидали в сомнительную базу, а на вопрос о перемодерации ссылались на якобы неуник. контент. Обычно модератор смотрит главную и делает макс. 2 клика вглубь сайта. Значит нужно сделать так, чтобы модератору не попался неуник. контент. Имхо тут всё зависит от модератора, по этому мы отказались от подобных текстовок после первого же прецендента :)
Мы не генерируем связанные предложения. Сайты наполняются т.н. "табличными данными", причём, это не тупой рандомайз. Зачем плевать выше головы ;)
И дорвеи делаем и партию псевдо-СДЛ как раз готовим. Зачем отдавать часть пирога, сапа очень неплохо монетизируется для своих трудозатрат, а несколько тыс. рублей в сутки лишними никогда не бывают.
Приходится закрывать глаза на беспредел модераторов, с другой стороны они дают нам повод делать сайты ещё лучше, просто обидно, когда их даже не смотрят. Я трачу больше времени на просмотр логов, чем на создание пачки сайтов. Вот и спрашиваю совета, может кто в курсе чем руководствуются модераторы. Другими словами, как делать сайты ещё лучше :)
Давайте без подкалываний, мы команда профессионалов с > 10 летним опытом веб-разработки. Что зазорного в том, что люди хотят заработать больше денег :) Мы выбрали такой путь, нагло не воруем чужой контент и не лепим откровенные ГС.
Alex91, да стрёмно уже писать в саппорт, сначала прокатывало, а потом стали отвечать -фигушки. Судя по всему там такие же модераторы сидят. Ходят слухи, что бывали случаи, когда после таких обращений в сомнительную базу кидали и сайты из основной (наверное речь шла об откровенных ГС'ах) :) А в правилах сапы сказано что они против генерёного контента, хотя сайты такого качества, что никакой АГС их не берёт, т.к. весь упор мы ставим на качество и количество :)