Setor

Рейтинг
8
Регистрация
23.06.2009
entropy:
Setor, да будь любезен добавь многопоточность.
Синхронизировать чем будешь, мьютексами или семафорами?
Ты вначале найди пхп-интерпретатор, способный обеспечить эту самую многопоточность.
Там многие bandled функции содержат статические переменные, что далеко не reenterant

Я использую PCNTL, но можно эмулировать и другими способами. Вот где действительно есть проблема - утечка памяти из-за глупого gb, в 5.3 проблема должна быть решена, пока не тестил. Так что ПХП вполне подходит под эти задачи.

Кто воздражал против шаблонизатора - вам ещё не надоело в каждом шаблоне делать по 4 почти одинаковых файла index, category, page, map?

А со смарти я генерю доры любой структуры и сложности. Хоть сателлиты под сапу генери :)

Каждый любит свой дорген и считает его лучшим.

entropy:
Дело в том, что в PHP любая сущность, будь-то переменная, массив, объект функция, и т.д. во внутреннем представлении самого языка хранится в виде хэшей.
У хеш-массивов есть очень неприятная особенность. Чем больше элементов, тем больше время доступа к i-тому элементу.
В отличии от языков, в которых происходит обращение к сущностям по адресу памяти.

int var[100500];
.... инициализация
int *ptr=var;
ptr+=5000;
std::cout<< *ptr;

В сях, плюсах, дельфях, жабах, питонах массивы правильные.
Время обращения к любому элементу не зависит от размерв массива.
В дотнете массивы кривые. Там почему-то зависит(странно как и почему).
Жаль, но пхп лишь отправная точка к изучению более серьезных вещей.
Я тебя убедил?

Меня не нужно убеждать, я не экономлю на спичках. Тут у нас не энтерпрайз. Но бывают случаи, когда увеличение производительности на секунду выигрывает часы времени. А стоит только добавить многопоточность, как скорость вырастает ~ в Х кол-во ядер, что тоже очень весомо.

true-NuB:
1) И че ? Хоть миллиард классов напиши, крутости это доргену не добавит.
смешно
2) Обычная скорость, чем хвастаться ?

Тем, что все паблик доргены - это лажа. Плохо масштабируются и показывают примерно такую же скорость генерации, но при этом весь код написан на дошкольном уровне 5 лет назад, а последние годы лишь исправляются баги, причём во время исправления - вносятся новые.

Аналог РБ пишется за неделю.

Я хочу сказать лишь одно - дорген - это лишь инструмент, чаще всего очень тупой, нужно думать своей головой и обязательно максимально автоматизировать весь процесс.

R0m4n:
А зачем тебе одновременно заливка и распаковка по фтп + filezilla ? :D :D :D

Не все хостинги поддерживают PHP, а залить 100500 файлов через PHP - садомазахизм. Смешно, да? :) Представляю как всеми любимый РБ зальёт 1000 доров в сутки ;)

Kyzmit4:
У DMI как раз нормальное и оптимальное количество макросов, с помощью которых можно реализовать любой изврат, а не как у некоторых - черт голову сломит, туча макросов, которые все даже и не запомнишь. Все гениальное — просто!😂

DMI очень прост. Процесс генерации более удобен при минимуме настроек (по сравнению с РБ). Больше всего не хватает генерации категорий, это и многие другие мелочи подтолкнули меня к написанию своего доргена.

Приведу злободневную проблему: у меня есть 10 шаблонов и я хочу сгенерить на них 5 тематик доров, но как проставить ссылку на ТДС не клонируя шаблоны? Всё приходится делать через задницу.

И меня просто добивают некоторые мелочи: при сабмите хостов в задание - если оставить лишнюю пустую строку, то DMI выдаст ошибку. Если допустить ошибку в шаблоне, то получим ошибку питона и догадывайся сам что не так. Если у меня динамический IP - DMI постоянно теряет лицензию, приходится удалять её и ставить заново + как было замечено, недавно автор профачил домен с валидацией лицухи, пришлось прописать IP в hosts.

По алгоритму генерации текста: ключевик вставляется либо вначале строки либо вконце. При всей его морфологической генерации текста я ожидал что ключевики будут вставляться более умно.

Очень плохо скачиваются фотки (хотя у знакомого на ДМИ качаются нормуль).

Если при заливе задания посреди залива пропадёт интернет, считай придётся генерить всю пачку заново.

И пришлось сильно поднапрячься чтобы установить нужную версию питона и sqlite на ubuntu-сервер.

Вердикт: большинству дорген будет удобен и на нём генерить удобней, чем на РБ. Сам находит текстовки, выкачивает картинки, сам может собрать ключи. Быстро привыкаешь к мелким косякам, на это обычно не обращают внимания.

Setor добавил 30.07.2010 в 15:19

Расскажу про свой дорген (комплекс).

Дорген написан на PHP5.2, полностью ООП, включает в себя более 50 классов. Использует внешние библиотеки: Smarty для шаблонов, PHPmorphy для морфологии, Pclzip для архивации (залив и распаковка зипов по FTP), jspacker для упаковки javascrip редиректа и другие менее значимые библиотеки. Генерация заданий для файлзиллы, ссылок для хрума.

Всё автоматизировано, скорость генерации 30 секунд на 500 страниц. При всём обилии кода падение производительности по сравнению с тем же РБ минимально. И кто сказал что Smarty самый тормозной шаблонизатор? :) Зачем изобретать велосипед, сложные макросы, зачем учитывать вложенность блоков, если всё это уже написано.

Своя "кнопка бабло" на PHP. Говоришь ей сколько денег хочешь заработать и как быстро, остальное делает сама 🚬

Не знаю почему все так хвалят DMI, тоже на нём генерил (мало макросов) и на РБТ генерил, но слишком много ручной работы, пришлось всё автоматизировать.

<!--WEB-->:
Цитата:
Сообщение от Setor
очень качественно сгенерирован
Цитата:
Сообщение от Setor
на сайт вообще ни кто не заходил кроме робота сапы

Может дело в этом?

А что вы хотите от молодого сайта в очень конкурентной тематике через 1-2 дня после индексации? Если бы это были откровенные ГС, я бы тут не позорился :) Траф по низкочастотке пойдёт через недельку, но вопрос в том, почему модератор не заходил на сайт - это его работа.

P.S. не надо так остро беспокоиться о качестве генерёного контента, это вам не доры на марковке. При закупке ссылок видно что в сапе очень много сайтов с генерёным бредотекстом, по этому я понимаю ваши эмоции :)

alex063:
Я бы не был бы так уверен... По моему проскакивали отказы в модерации с пометкой "не уникальный контент"....

Смотрят, были преценденты, когда из-за небольшого скопипатенного абзаца весь сайт кидали в сомнительную базу, а на вопрос о перемодерации ссылались на якобы неуник. контент. Обычно модератор смотрит главную и делает макс. 2 клика вглубь сайта. Значит нужно сделать так, чтобы модератору не попался неуник. контент. Имхо тут всё зависит от модератора, по этому мы отказались от подобных текстовок после первого же прецендента :)

Burner-M:
Setor, на уникальность контента модеры не смотрят, а раз уж контент "сгенерирован", то, взглянув на 2-3 случайно выбранные абзаца, модеры это понимают (как-бы качественно вы не генерировали - человек всегда отличит), и тут уж никакой дизайн не поможет.

Мы не генерируем связанные предложения. Сайты наполняются т.н. "табличными данными", причём, это не тупой рандомайз. Зачем плевать выше головы ;)

den78ru:
Если вы действительно профи в генерации, то идея клепать качественные дорвеи или псевдо СДЛ под трафик вам бы уже давно пришла в голову.

И дорвеи делаем и партию псевдо-СДЛ как раз готовим. Зачем отдавать часть пирога, сапа очень неплохо монетизируется для своих трудозатрат, а несколько тыс. рублей в сутки лишними никогда не бывают.

Приходится закрывать глаза на беспредел модераторов, с другой стороны они дают нам повод делать сайты ещё лучше, просто обидно, когда их даже не смотрят. Я трачу больше времени на просмотр логов, чем на создание пачки сайтов. Вот и спрашиваю совета, может кто в курсе чем руководствуются модераторы. Другими словами, как делать сайты ещё лучше :)

den78ru:
Думаю, лечиться вам уже поздно, такое не лечится.

Половина 7-го А?

Давайте без подкалываний, мы команда профессионалов с > 10 летним опытом веб-разработки. Что зазорного в том, что люди хотят заработать больше денег :) Мы выбрали такой путь, нагло не воруем чужой контент и не лепим откровенные ГС.

Alex91, да стрёмно уже писать в саппорт, сначала прокатывало, а потом стали отвечать -фигушки. Судя по всему там такие же модераторы сидят. Ходят слухи, что бывали случаи, когда после таких обращений в сомнительную базу кидали и сайты из основной (наверное речь шла об откровенных ГС'ах) :) А в правилах сапы сказано что они против генерёного контента, хотя сайты такого качества, что никакой АГС их не берёт, т.к. весь упор мы ставим на качество и количество :)

12
Всего: 11