Подобная "защита" не имеет никакого смысла - Вы создаёте два разных набора текстов, не связанных между собою и имеющих разную ценность (как смысловую для пользователей, так и "алгоритмическую" для ПС).
Проще тогда в джипегах отдавать, действительно.
nocopypastecom, научитесь прямо отвечать на прямо поставленные вопросы.
Пока-что Вы по факту не защищаете исходный материал, а создаёте из него новый контент. "Попробуйте всё-таки понять смысл последнего предложения": уничтожение исходника прямо противоположно защите его от копирования.
А то, что перестановка слов влияет на выдачу - можно проверить в самой выдаче, хоть сейчас. Сравните выдачу по запросу "маша мыла раму" и "раму мыла маша" - она не идентична. Так на каком основании Вы утверждаете, что "набор слов из любой статьи для поисковика обладает равной релевантностью в любом порядке"?
Будет ответ?
В каком смысле "адекватно"? Вот Ваши слова:
Откуда Вы это знаете?
И Вы понимаете, что генерация контента на базе исходного текста - не равна и не может называться защитой этого исходника от воровства? Ведь Вы теряете исходник - что тогда защищается?
Что Вы подразумеваете под лексическим анализом?
На чём основано утверждение, что алгоритмы ПС не учитывают порядок слов в пассаже?
Вы переставляете слова. Все остальные замечания - остаются в силе.
Будут комментарии по ним?
Никому не хочется терять зря время. Тем более, если Вы не способны даже наметить техническую часть, не говоря об обосновании.
Или способны?
Сколько в них сообщений, в среднем на тему? Где больше всего?
Так в чём разница?
Поисковику не важно, как именно Вы подменяете содержание (через перестановку слов, искусственно создавая различные опечатки, заменяя часть символов на латинницу и пр.) - в любом случае исходный текст теряется, а с новым текстом будут работать новые правила индексации и ранжирования (не факт, что подобный "текст" вообще в индекс попадёт).
По каким признакам это будет "защитой от воровства"? Это есть разновидность автоматического рерайта, причём достаточно примитивная.
Что Вы имеете в виду под лексическим анализом?
Разве? Особенно "в любом порядке" интересует.
Так она и ранжироваться будет тогда, как текстовая каша (или как дорвей), со всеми вытекающими.
Про клоакинг (подмену содержания для разных типов посетителей) уже заметили, и это тоже далеко не плюс предлагаемого метода.
Вы не могли бы описать всё это несколько более техническим языком?
WEBnutiy, можно подробнее?