.:nbd:.

.:nbd:.
Рейтинг
98
Регистрация
04.11.2008
ext3:
Странно тогда....

Что странного?

Какая разница между

$keywords = array("key 1", "key 2", "key 3", "key 4", "key 5");

print($keywords);

и

$keywords = array("key");

print($keywords);

Правильно, никакой.

ТС, вы помоему что-то не то делаете, для этих целей используется <!-- hesoyam rb --> (это ссылка). Это специальный разделитель для блоков которые будут повторяться на странице дора и для каждого блока будет использоваться свой кейворд и текст. Примерно так

<!-- hesoyam rb -->

[KEYWORD]<br />

<p align="justify">[TEXT-10-20]</p>

<!-- hesoyam rb -->

targaa:
Его в асе нету сейчас) Да и вроде про ко.тв он не говорил ничего.

Регает, в асе действительно пока нет, скоро появится =)

Ладно, не бери в голову, у меня еще немного есть прозапас.

А я расстроен :( И Geo тоже думаю расстоится, когда увидит этот тред. Домены ушли в массы :( Жаль.

TopperHarley:
серьезно?
наверно ты догадался - заменить на =, бросается в глаза

Не, тут нет ошибки =) Так как переменная $success не была ранее объявлена, то ее значением будет 0, функция fwrite вернет 0 если данные записать не удастся или количество записаных байт информации если запись удалась. В конечном итоге получится обычная разница 2-ух чисел, а то что результат никуда не сохраняется, для пыха это мелочи, максимум мы тут получим нотис типа андефайнед вариэйбл $success .

а вот вопрос нафига оно там было надо остается открытым.

И да, уже вроде бы давненько логин в ВК находится по адресу http://login.vk.ru/

mailreger:
"скриптовый язык"
эмс... это что?!

Любой интерпретируемый язык программирования, так же как и язык программирования сценариев.

Дeнис:
Абсолютно читаемый и связный рассказ без использования конструкций, написанных руками, имхо, нельзя создать. Я про конструкции типа "{большая|красная} машина". А это сотни, а может и тысячи человеко-часов под каждую узкую тематику.

Так и нет цели написать программу как у Донцовой, которая генерит книги с детективным сюжетом и смыслом. Есть цель написать программу которая в состоянии сгенерировать текст, который сможет пройти проверку алгоритмами пс.

BredoGen.:
Первый - просто меняем местами слова с одинаковыми признаками в размеченном тексте. Рассматривать подробно, думаю, не стоит.

Неестественность текста будет достаточно легко палиться при частотном анализе слов (или их пар). Для примера возьмем 2 одинаковых по структуре предложения:

Партия напильников отправилась на прилавок магазина.

Стая лебедей улетела на юг Франции.

Если заменить каждое второе слово второго предложения на каждое второе слово первого предложения получим:

Стая напильников улетела на юг магазина.

Разбиваем предлжение в цепь по 2 слова, получаем:

стая напильников;

напильников улетела;

улетела на;

на юг;

юг магазина.

весьма сомнительно что пары слов под номерами 1, 2 и 5, достаточно часто встречаются в естественном тексте. Соответственно достаточно легко палятся.

Второй вариант - это использование цепей Маркова, в качестве цепей рассматривая схожие наборы граммем и части речи. Для наилучшего результата, скорее всего, придется создавать базу для хранения цепей и пополнять её. Для упрощения задачи, можно использовать модуль морфологического поиска, который поддерживает поиск по морфологическим признакам и частям речи. Мне этот модуль не нужен, поэтому не ковырял.

Тут я так понял речь идет о том, что по алгоритму цепей Маркова составляются шаблоны, в которые затем подставляются слова соответствующие признакам шаблона? Тогда получим такой же бредотекст как и в первом случае.

Кстати, тут еще есть одна проблема, для чего именно этот текст будет использоваться. Как самомтоятельная единица, ала готовый контент для сатов или как база для дальнейшего использования в дорах. Если второе, то тут нужно будет еще правильно вписать ключевые слова в полученный текст, после чего он станет еще более безобразен.

А что если пойти от обратного, не генерировать текст с дальнейшей вставкой или заменой части слов на ключевые, а генерировать текст исходя из ключевых слов?

1) Сделать выборку наиболее частых слов по частям речи и использовать ее в качестве словаря.

2) Подготовить частовстречающиеся в естественном тексте шаблоны предложений.

3) Определить признаки слов в кее и выбрать наиболее оптимальные шаблоны.

4) Подставить в шаблоны наш кей, а затем оставшиеся позиции заменить на слова соответствующие признакам.

Единственное что в таком тексте процент кеев будет зашкаливать, но его можно понизить если использовать промежуточные прдложения без вхождения кеев или использовать синонимы слов в кее. Короче, как-то так :)

Если кому не терпится, то можете попробовать пока попарсить моим парсером.

Скрипту нужны ан-ти-ка-п кей, curl, права на запись. Скрипт прост до безобразия, потому отдельно объяснять в нем нечего :)

На вордстате чуть поменяли имена стилей, потому и не парсит.

Всего: 1352