- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Доброго времени суток всем!
Пишу дорген и возник такой вопрос: а как же генерировать текст?
Подскажите алгоритмы какие-нибудь. Гугл и Яндекс только о марковских цепочках походу знают.
Так я думаю Вам никто не даст полный листинг программы - генератора текста. Могу одну функцию привести в пример, если на PHP пишите, все поймете.
function generate($data, $words_co,$pages_co)
{
$result = array();
$content = "";
foreach ($data as $con)
{
$regexp = "/<[^>]+>/";
$res = preg_split($regexp,$con);
$m = 0;
foreach ($res as $kusok)
{
if (strlen($kusok)>$m)
{
$m = strlen($kusok);
$ms1 = $kusok;
}
}
$m = 0;
foreach ($res as $kusok)
{
if ((strlen($kusok)>$m)&&($kusok!=$ms1))
{
$m = strlen($kusok);
$ms2 = $kusok;
}
}
$itog = strtolower("$ms1 $ms2"
$content.="$itog ";
}
$regexp = "/[^a-z0-9]+/";
$content = preg_replace($regexp," ",$content);
$regexp = "/\s+/";
$temp = preg_split($regexp,$content);
$words = array();
for ($i = 0; $i<count($temp)-1; $i++)
{
if (!$words[$temp[$i]]) $words[$temp[$i]] = array();
$words[$temp[$i]][] = $temp[$i+1];
}
for ($i = 0; $i<$pages_co; $i++)
{
$r = rand(0,count($temp));
$w = $temp[$r];
$con = "";
for ($j = 0; $j<$words_co; $j++)
{
$r = rand(0,count($words[$w])-1);
$word = $words[$w][$r];
$w = $word;
$capit = false;
$r = rand(0,1000);
if (($r>100)&&($r<180)) $capit = true;
if ($capit)
{
$con.=".";
$word[0] = strtoupper($word[0]);
}
$con.=" $word";
}
$result[] = $con;
}
return $result;
}
}
?>
<?
все что здесь пишут на открытой борде Гугл и Яндекс знает ;)
у меня до сих пор морковка обычная хавается (хоть и с переменным успехом) яндексом и рамой. иногда генерю для прикола стареньким доргеном посмотреть :)
и это далеко не самы примитивный способ, полученный по которому контент жрётся.
могу советовать попридумывать всякие разные способы, покодить. вполне вероятно, что что-нибудь придумается действенное.
1. парсишь сайт порно рассказов -100 мег рассказов
2. пишешь скрипт который который меняет предложения местами
3. в итоге уникальный, и нормальный по смыслу текст для доров
думаю такой текст можно назвать уникальным только с большой натяжкой
рождаешь систему событий (мир), описываешь его возможные варианты паттернами, добавляешь небольшой фарш по причастным всяким оборотам, вводным словам - реализовать не так сложно, а выглядит приятно. Вот тогда имеешь реально уникальный текст.
думаю такой текст можно назвать уникальным только с большой натяжкой
без всяких натяжек он уникальный
не надо доходить до абсурда и считать что за 1 предложение яндекс будет считать этот текст не уникальным.
почему за одно, за каждое предложение, пусть даже взятое из разных источников
рождаешь систему событий (мир), описываешь его возможные варианты паттернами, добавляешь небольшой фарш по причастным всяким оборотам, вводным словам - реализовать не так сложно, а выглядит приятно. Вот тогда имеешь реально уникальный текст.
Очень хорошо описано в "Морфологии сказки". Надо будет побороть лень и написать что-нить подобное...
Очень хорошо описано в "Морфологии сказки". Надо будет побороть лень и написать что-нить подобное...
нашел, но букф много - нереально в пятницу вечером читать. дашь краткую выдержку за симпу? :)