Комментарии - BredoGen - Профиль вебмастера - Форум об интернет-маркетинге

Бредотекст по алгоритму Маркова - текст на тест

21 декабря 2009, 16:31

.:nbd:.:
Зачем, что-то удалять? Может имеет смысл использовать ровно столько, сколько они встречаются в живом тексте?

На большом объеме сразу видно опечатки, слова с ошибками и другие артефакты. (например глюки сканера и обрывы слов с переносами)

Поэтому удалял этот мусор, которого не бывает в живом тексте. Чем больше исходный объем, тем виднее несовпадения - может яндекс как раз по такой статистике и фильтрует?

Бредотекст по алгоритму Маркова - текст на тест

21 декабря 2009, 15:43

deZigner:
Зачем нужно обрабатывать по 10 Гиг текста?

Чтобы набрать большое количество разных вариаций. Больше цепей, лучше уникальность - проще вычислить мало употребляемые сочетания и удалить. Пропадает необходимость парсить новые тексты. Даже при совпадении по шинглам источники будут разные.

Бредотекст по алгоритму Маркова - текст на тест

19 декабря 2009, 22:27

Jet D.:
статистических проверок.

Что не так со статистикой?

Вопросы по дорвеям от новичка

19 декабря 2009, 17:34

Amid1990:
но народ это ведь фрихост яндекса наверника у него к нему особое отношение.

Да.

Amid1990:
более жесткие фильтры?

Нет.

Бредотекст по алгоритму Маркова - текст на тест

19 декабря 2009, 17:26

Solo_by:
По всей видимости в генераторе знаки препинания считаются как обычные слова.

Нет, разбивал только по словам которые больше 3 букв, но сохранял знаки препинания. Сейчас база для сборки больше 2 гигов, это несколько миллионов звеньев. Было обработано больше 10 гигабайт текстов! (книжек, статей, сайтов) Текст очень уникальный - тщательно отфильтрован весь мусор. (зоо, дети и др.) В выдачу залетает нормально, но есть проблемы при подмешивании ключей, думаю как лучше замешать.

Наверняка обеспечить более интенсивный оргазм, всего пять воцарилась тишина, после того как дверь за ней закрылась, он немедленно призвал суд более скрупулезно рассмотреть ее получше. Вышагивал господин Маниго, достаточно было что - то знать. Девушки до первого отряда, все двадцать три - курят. Но и холодное оно тоже чудесно, ты должна с ним тотчас ринулась к Жанне в глаза. Прогулок катания на лыжах, - прервала она затянувшееся молчание. Вчерашней веранде за солнечным утренним воздухом, пятеро ушли с занятий, джой вызвала буквально фантастический результат. Иногда, после близости пусть прочитает окончание романа - уже не одно перевести разговор не скрою, поначалу у меня были милые, добрые, благородные мужчины. Мой член в свою узкую дырочку, и когда уже нет смысла об этом направлении не наблюдается. Когда говорил, что нам не следует сказать несколько километров, я наконец, что особенно неприятно, обвил руки и она стащила ее через его голову. Рик и тут попытался сформулировать фразу голые тела запах женских выделений и я похотливо постанывая, с радостью согласился. Подобная боязнь слишком близких отношений называется башней Жанны у меня Марк с облегчением но с наслаждением выдохнула. Протянув руку, из ее трусиков и притворился, будто вспомнил что - то очень важное, в гардеробе в кармане пальто, ждёт вашей девушки? Как на средство возбуждения, а уделить прическе невесты. Маша постояв минут двадцать тут надо поэтому не забудьте, купить. - Тихо, сказала Элинор, удивляясь и тому, может ли мужчина сознательно использовать мы можем только поддерживать чувственное наслаждение с его стороны, это такая она! Однако ритм их движений языком вдоль побережья на яхте.

Еще немного текста, если надо больше, спрашивайте - выложу еще.

zip 05.zip

zip 06.zip

zip 07.zip

zip 08.zip

zip 09.zip

PandoraBox - новый дорген.

18 декабря 2009, 15:05

Solo_by:
А вот такой будет нужен? ;)

Думаете хуже?

лучше, только надо оставить кнопку "поехали" и убрать все остальное

Нарисую промо баннеры для любых доров

18 декабря 2009, 14:32

adulthood:
Я составляю промо баннеры, имитацию сайтов и т.д.

бизнес пошел?

Обсуждение влияния последнего Апдейта на Дорвеи

18 декабря 2009, 13:06

Ел хорошо, в выдаче маловато.

Переиграть и победить: как анализировать конкурентов для продвижения сайта

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи

BredoGen