хе хе многие тут не знают что такое ssh и пользуются встроенными заливалками доргенов или файл менаджерами...
палю тему:
"Например, если дорвейщик из 100 Кб текста нагенерил 10 Мб, он каждое словосочетание использует где-то 100 раз. Ну и вероятность, что ты попадешь на уникальное в пределах сайта словосочетание – порядка 1%. А 99 будут неуникальных."
для маркова бери больше материала(мегабайтами а лучше десятками) (для пачки дорвеев НЕ НА ОДНОМ ХОСТЕ И НЕ ПЕРЕЛИНКОВАННЫХ)и такого чтобы ПС как можно меньше про него знала(в идеале какой нить старинный талмуд 4-5 словные фразы из которого ПС в жизни не находит)...
тогда и марков с него на каждом доре будет уникальным. (голое перемешивание - бесполезно)
все имхо.
Мне помогли высшие силы. :)
http://www.prgmm.ru/articl/1026_
интересную статейку нашел про
А как бороться с «дорвеями по цепям Маркова»
"А поскольку дорвейщик текста нагенерил в 10-100 раз больше, чем был исходный текст, словосочетания там поюзаны многократно. Гораздо больше, чем 1 раз. Конечно, дорвейщик разбил текст по страницам, так что ловить надо в пределах сайта.
В принципе, даже ресурсов много не надо… Пробить по нескольким хорошим крупным сайтам свойства текстов. Прикинуть, например, сколько из 10 тыкнутых наугад пар слов встречаются на сайте более 1 раза. Допустим, 10-30%.
А у дорвейщика будет сильно больше 99%. Например, если дорвейщик из 100 Кб текста нагенерил 10 Мб, он каждое словосочетание использует где-то 100 раз. Ну и вероятность, что ты попадешь на уникальное в пределах сайта словосочетание – порядка 1%. А 99 будут неуникальных."
2mr_DEMON
как ты себе эту программу представляешь?
spambot добавил 14.12.2008 в 01:32
2lord_alfred
ой ей ей какая вкуснятина!
2prtev
а ты что никогда не гасил инет? это проще чем кажется :-D
2Murzzz да ну не думаю, если хочешь то проснифай что дорген запрашивает с сервака, а потом со своего сервака подними какой нить апач и эмулируй это....
Да тоже вот стремновато а вдруг еще и фтп уведет при заливке стуканет всю инфу :-D
2Murzzz не будь параноиком :) а ваще я запускаю прогу генерю первый тестовый дор а потом гашу инет и генерю доры далее....норм дорген для фришника. все равно лучше чужого может быть тока самописный :)