ну здесь только два варианта.
либо это бот поисковика (проверяет сайт на клоакинг, может еще на что-то)
либо бот не поисковика (ну тут остается только гадать, что нужно этому боту)
да. ну я скопипастил шаблоны из файлика, а абзац уже сгенерился, рандомно взяв из файла несколько шаблонов.
по поводу маркова, ну или как угодно можно называть:
наверное его придется применить два раза (минимум).
первый раз: на этапе (подлежащие, сказуемое)
второй раз: обрамить предожение прилагательными, наречиями и пр.
т.е.
1. стакан стоял
2. стакан стоял на столе (здесь наверное трудно придется)
ну и в идеале
3. хрустальный стакан гордо стоял на обеденном столе
ну это мысли в слух. :)
у мення "Server not found" на флеш-ролике выкидывает.
о чем там говорится? (вкратце)
прочитал щас свой договор с webnames за 2000-лохматый год.
про порно и эротику не сказано ни слова.
только про мыльный спам и
"материалы, противоречащие законодательству РФ".
как это можно трактовать - я х.з. Вроде порно запрещено.
а по поводу реги доменов с 1 октября - тоже вроде никто не знает.
может скан паспорта по мылу отослать, а может как раньше - с паспортом к регистратору или к нотариусу.
ну здесь как посмотреть. в топе иногда вылазят странички с тупо "последние запросы с поисковиков"
по идее такая страница является дором, но никто ресурс не банит. (ресурс естественно не свежезареганный).
такая же ситуация и с блогами\форумами. если двадцать комментаторов упомянут в своем послании титл страницы и заголовок в <h1>, то это будет дором?
много вопросв, ответ наверное как всегда, где-то посередине.
да я вот тоже думаю взять словарик хотябы на 5000 слов и посмотреть словосочетания на lib.ru
например "мягкий стол"
http://www.google.ru/search?hl=ru&source=hp&q=site%3Alib.ru+%22%D0%BC%D1%8F%D0%B3%D0%BA%D0%B8%D0%B9+%D1%81%D1%82%D0%BE%D0%BB%22&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA+%D0%B2+Google&lr=
не катит
а какой стол катит
http://www.google.ru/search?hl=ru&newwindow=1&q=site%3Alib.ru+%22*+%D1%81%D1%82%D0%BE%D0%BB%22&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&lr=
может обеднный?
http://www.google.ru/search?hl=ru&newwindow=1&q=site%3Alib.ru+%22%D0%BE%D0%B1%D0%B5%D0%B4%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9+%D1%81%D1%82%D0%BE%D0%BB%22&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&lr=
ну типа того :)
ну я вроде почти тоже самое делаю. есть куча предложений одного автора.
в итоге после прогона получаю такие шаблоны:
С ЕД,ИМ,ИМЯ,МР,ОД-----ЧАСТ -----Г ДСТ,ЕД,МР,НП,ПРШ,СВ-----ПРЕДЛ -----С ВН,МН,НО,СР
МС 2Л,ЕД,ИМ-----КР_ПРИЛ ЕД,КАЧ,МР,НО,ОД-----ИНФИНИТИВ ДСТ,НП,СВ-----ПРЕДЛ -----С ДТ,ЖР,МН,НО-----С ИМ,МН,МР,ОД
МС 1Л,ЕД,ИМ-----Н -----Г 1Л,БУД,ДСТ,ЕД,НП,СВ-----ПРЕДЛ -----МС 2Л,ЕД,ТВ
ПРЕДЛ -----С ЕД,МР,НО,ТВ-----Г ДСТ,ЕД,МР,НП,НС,ПРШ-----МС 1Л,ЕД,ИМ-----ПРЕДЛ -----С МН,МР,НО,РД
МС 2Л,ИМ,МН-----ЧАСТ -----Г ДСТ,МН,ПЕ,ПРШ,СВ-----ПРЕДЛ -----С ВН,ЕД,МР,ОД
С ЕД,ИМ,ИМЯ,МР,ОД-----Г ДСТ,ЕД,МР,ПЕ,ПРШ,СВ-----С ДТ,ЕД,ИМЯ,МР,ОД-----ИНФИНИТИВ ДСТ,НП,НС-----ПРЕДЛ -----С ДТ,ЕД,МР,НО
но в итоге при генерации получается не совсем то.
Я ОБУЛСЯ ПОЗАДИ ПОЧЕЧНУЮ КАБАЛУ . ФАЛЬШИВУЮ ПРОСЕКУ ОБУЯЕШЬ ПОПЕРЕК НЯНЕ . СЗАДИ ОРБИТАМ ПУТЕШЕСТВЕННИКА ИСЧЕРПАЛАСЬ ПРОХОДИМОСТЬ . Я Ж ЖМУ ОПЕРИРОВАТЬ РЕВИЗОРОМ . ПЕРЕВАЛИЛСЯ ОСТОРОЖНО ФЛОР ВОПРЕКИ МНЕ . РАДЖ ЗДОРОВО ТКНУЛСЯ СВЕРХУ НАУЩЕНЬЯ . ТЫ ЗАКУЛИСЕН ПРОСТИРАТЬСЯ ВОЗЛЕ УТВАРЯМ БИЗОНЫ . Я ГАДКО НАРОЖУСЬ ПОД ТОБОЮ . ВРОДЕ ГОНГОМ ЦЫКАЛ Я РАДИ СТАФИЛОКОККОВ . ВЫ РАЗВЕ ГЕРМЕТИЗИРОВАЛИ ПЛЮС ПРОФЕССИОНАЛА .
морфология вроде угадывается, но не везде и не в тему.
а у тебя вроде похоже на морфологический синонимайзер.
/ru/forum/146934
нашел твой топик.
ну я сейчас по такому же пути иду.
хотел сделать несколько сотен шаблонов для генерации предложений. скачал десяток книжек одного автора. с помощью aot сгенерил шаблоны, и оставил только те, в которых не встречаются омонимичные словоформы.
ну итог хреновый. генерит полную неморфологическую хрень.
придется видимо руками составлять каждый шаблон и генерить, смотреть, править по несколько раз каждый шаблон.
ну я даже не знаю по каким кеям искать эти обсуждения.
давай еще раз обсудим.
ну предложение должно генериться с морфологией. ключевик вставляться тоже с морфологией.
частотность сгенеренных словосочетаний проверить например на lib.ru
что еще можно сделать?
А как он должен выглядеть? (идеальный генеренный контент)
Спали ТЗ.