Дeнис

Дeнис
Рейтинг
67
Регистрация
14.05.2009
corifey:

ну а насчет подставного рефера? у кого были подобные случаи? зачем кто-то (может сам яша) имитирует заход из поиска на мой дор с поисковой фразой хотя при повторе вручную этого запроса в выдаче пусто.

ну здесь только два варианта.

либо это бот поисковика (проверяет сайт на клоакинг, может еще на что-то)

либо бот не поисковика (ну тут остается только гадать, что нужно этому боту)

response:
я туплю, или у тебя в квоте примеры с шаблонами не сходятся?



...то получится прокачанный аггрегацией марков. Неплохая штука, но не то.



чудеса :)

да. ну я скопипастил шаблоны из файлика, а абзац уже сгенерился, рандомно взяв из файла несколько шаблонов.

по поводу маркова, ну или как угодно можно называть:

наверное его придется применить два раза (минимум).

первый раз: на этапе (подлежащие, сказуемое)

второй раз: обрамить предожение прилагательными, наречиями и пр.

т.е.

1. стакан стоял

2. стакан стоял на столе (здесь наверное трудно придется)

ну и в идеале

3. хрустальный стакан гордо стоял на обеденном столе

ну это мысли в слух. :)

rushter:
http://seopult.tv/video/regnew/
Смотрите и вникайте.

у мення "Server not found" на флеш-ролике выкидывает.

о чем там говорится? (вкратце)

прочитал щас свой договор с webnames за 2000-лохматый год.

про порно и эротику не сказано ни слова.

только про мыльный спам и

"материалы, противоречащие законодательству РФ".

как это можно трактовать - я х.з. Вроде порно запрещено.

а по поводу реги доменов с 1 октября - тоже вроде никто не знает.

может скан паспорта по мылу отослать, а может как раньше - с паспортом к регистратору или к нотариусу.

blagen:
гемор это и всёравно 3 апа яши и большой траф кончится. надо всё херачить обычным рб, чуть юзать сео и брать количеством. на всё ваше качество яша ложит свой жирный уй.

ну здесь как посмотреть. в топе иногда вылазят странички с тупо "последние запросы с поисковиков"

по идее такая страница является дором, но никто ресурс не банит. (ресурс естественно не свежезареганный).

такая же ситуация и с блогами\форумами. если двадцать комментаторов упомянут в своем послании титл страницы и заголовок в <h1>, то это будет дором?

много вопросв, ответ наверное как всегда, где-то посередине.

sokol_jack:
Палю тему - если не поленится и собрать словарь н-грамм (встречаемость двух слов рядом), то... ;)

да я вот тоже думаю взять словарик хотябы на 5000 слов и посмотреть словосочетания на lib.ru

например "мягкий стол"

http://www.google.ru/search?hl=ru&source=hp&q=site%3Alib.ru+%22%D0%BC%D1%8F%D0%B3%D0%BA%D0%B8%D0%B9+%D1%81%D1%82%D0%BE%D0%BB%22&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA+%D0%B2+Google&lr=

не катит

а какой стол катит

http://www.google.ru/search?hl=ru&newwindow=1&q=site%3Alib.ru+%22*+%D1%81%D1%82%D0%BE%D0%BB%22&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&lr=

может обеднный?

http://www.google.ru/search?hl=ru&newwindow=1&q=site%3Alib.ru+%22%D0%BE%D0%B1%D0%B5%D0%B4%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9+%D1%81%D1%82%D0%BE%D0%BB%22&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&lr=

ну типа того :)

sokol_jack:
А я пошел по другому пути :)
Прогняю сейчас несколько сот мб текста через свою тулзу, которая разбирает предложение (граф зависимостей, тип и формы слов). И на выходе планирую получить массив "типичных" графов предложений (сущ. прилаг. глагол, например). Ну, а заменять слово А в предложении на слово Б с сохранением всех связей (например, из "Машина ехала по дороге" в "Автомобиль ехал по дороге") я уже умею :)

ну я вроде почти тоже самое делаю. есть куча предложений одного автора.

в итоге после прогона получаю такие шаблоны:

С ЕД,ИМ,ИМЯ,МР,ОД-----ЧАСТ -----Г ДСТ,ЕД,МР,НП,ПРШ,СВ-----ПРЕДЛ -----С ВН,МН,НО,СР

МС 2Л,ЕД,ИМ-----КР_ПРИЛ ЕД,КАЧ,МР,НО,ОД-----ИНФИНИТИВ ДСТ,НП,СВ-----ПРЕДЛ -----С ДТ,ЖР,МН,НО-----С ИМ,МН,МР,ОД

МС 1Л,ЕД,ИМ-----Н -----Г 1Л,БУД,ДСТ,ЕД,НП,СВ-----ПРЕДЛ -----МС 2Л,ЕД,ТВ

ПРЕДЛ -----С ЕД,МР,НО,ТВ-----Г ДСТ,ЕД,МР,НП,НС,ПРШ-----МС 1Л,ЕД,ИМ-----ПРЕДЛ -----С МН,МР,НО,РД

МС 2Л,ИМ,МН-----ЧАСТ -----Г ДСТ,МН,ПЕ,ПРШ,СВ-----ПРЕДЛ -----С ВН,ЕД,МР,ОД

С ЕД,ИМ,ИМЯ,МР,ОД-----Г ДСТ,ЕД,МР,ПЕ,ПРШ,СВ-----С ДТ,ЕД,ИМЯ,МР,ОД-----ИНФИНИТИВ ДСТ,НП,НС-----ПРЕДЛ -----С ДТ,ЕД,МР,НО

но в итоге при генерации получается не совсем то.

Я ОБУЛСЯ ПОЗАДИ ПОЧЕЧНУЮ КАБАЛУ . ФАЛЬШИВУЮ ПРОСЕКУ ОБУЯЕШЬ ПОПЕРЕК НЯНЕ . СЗАДИ ОРБИТАМ ПУТЕШЕСТВЕННИКА ИСЧЕРПАЛАСЬ ПРОХОДИМОСТЬ . Я Ж ЖМУ ОПЕРИРОВАТЬ РЕВИЗОРОМ . ПЕРЕВАЛИЛСЯ ОСТОРОЖНО ФЛОР ВОПРЕКИ МНЕ . РАДЖ ЗДОРОВО ТКНУЛСЯ СВЕРХУ НАУЩЕНЬЯ . ТЫ ЗАКУЛИСЕН ПРОСТИРАТЬСЯ ВОЗЛЕ УТВАРЯМ БИЗОНЫ . Я ГАДКО НАРОЖУСЬ ПОД ТОБОЮ . ВРОДЕ ГОНГОМ ЦЫКАЛ Я РАДИ СТАФИЛОКОККОВ . ВЫ РАЗВЕ ГЕРМЕТИЗИРОВАЛИ ПЛЮС ПРОФЕССИОНАЛА .

морфология вроде угадывается, но не везде и не в тему.

а у тебя вроде похоже на морфологический синонимайзер.

response:
БНФ, aot, Формула 1 (F1).

/ru/forum/146934

нашел твой топик.

ну я сейчас по такому же пути иду.

хотел сделать несколько сотен шаблонов для генерации предложений. скачал десяток книжек одного автора. с помощью aot сгенерил шаблоны, и оставил только те, в которых не встречаются омонимичные словоформы.

ну итог хреновый. генерит полную неморфологическую хрень.

придется видимо руками составлять каждый шаблон и генерить, смотреть, править по несколько раз каждый шаблон.

response:
на форуме все есть, в прошлом году и ранее обсуждали многократно и многобуквенно.

ну я даже не знаю по каким кеям искать эти обсуждения.

давай еще раз обсудим.

ну предложение должно генериться с морфологией. ключевик вставляться тоже с морфологией.

частотность сгенеренных словосочетаний проверить например на lib.ru

что еще можно сделать?

response:
х*йней маетесь. лучше бы потратили время на нормальный контент, которые поисковики жрали бы за милую душу без всяких еженедельных "тем" и прочего барахла для подмосковных лохов [x]

А как он должен выглядеть? (идеальный генеренный контент)

Спали ТЗ.

Всего: 907