А зачем писать, что это генератор уникальных текстов, если он таковым не является?
Это скорее генератор с анализатором похожести. Вот если бы он мог по заданному (в %) диапазону похожести отбирать тексты сразу при генерации...
И очень нехватает тонких настроек (исправление ошибок, сравнение и т.д.).
Вобщем, похоже, нужно дописывать свое, т.к. в сети не нашел ни одного нормального/вменяемого/удобного генератора с отбором.
Уникальны они только при простом сравнении, но далеко не уникальны для поисковиков, для которых вобщемто все и делается.
Многим в основном, если я не ошибаюсь, нужны не десятки тысяч и даже не тысячи вариантов с неизвестным процентом похожести, а десятки-сотни вариантов с определенной степенью похожести.
Вобщем пока юзаю программу только для написания формул из-за удобной подсветки синтаксиса.
У меня почему-то программка неправильно генерирует - первые несколько слов (в зависимости от размера текста) во всех вариантах остаются одинаковыми.
Пробовал множество разных формул - результат тот же.
--дубль-удален--
Он пока в сыром виде - просто набор ф-ций и их ручной вызов с ручными же параметрами. В общем неюзабелен он пока, хотя и работает.
Давайте лучше я прогоню через него несколько случайных вариантов статьи и сверю с оригиналом. Цифры выложу сдесь.
Я тоже так думал. Но проверка методом шинглов показывает обратное - найти нечеткие дубли - вообще не проблема. Другой вопрос - как его используют поисковики? Для работы с такими объемами информации они производят кластеризацию и сравнивают не каждый шингл, а супершинглы... тут, конечно, могут быть погрешности и весьма большие.
Я не хотел делать каких-либо окончательных выводов. А хотел понять насколько реальна возможность генерации текстов по формуле, чтоб поисковики их не склеивали.
Ручной лучше - но мне он не интересен по многим причинам.
Предложения и абзацы можно менять сколько угодно, но методом шинглов, в большинстве случаев, это вскрывается.
Интересно было бы услышать отзывы тех, кто переписывал себе страницы подобным образом. Как к ним отнеслись Я и G?
Я то же этой тулзой проверял, пока не написал свой скрипт проверки.
Меня удивила эфективность нахождения нечетких дублей методом шинглов. В отличии от этой утилиты дублю скрыться почти невозможно. По крайней мере у меня не получилось сгенерить тексты (>2К) со степенью похожести менее 3%. Ни чем не получилось.
По этой формуле:
сгенеренный с помощью SEO Generator текст имеет сходство с оригиналом в среднем на 6,7%. Провел 10 сравнений с оригиналом и получил такие цифры (похожесть в %): 7/11/8/0/7/7/3/0/3/21.
Vaster, быть может вы привели не самую удачную формулу, может у вас есть несколько десятков вариантов сгенеренного текста с похожестью 0-3%? Я бы прогнал своим скриптом, а то я как-то разочаровался в методе... :(
В том-то и дело... Сгенерил одну страницу из растиражированной в инете и заменил на своем сайте. Через несколько дней гугл обновил страницу с новым текстом. Но положение страницы так и не изменилось.
Сдается мне, что гугль легко отлавливает такие дубли... Насчет яндекса пока не знаю, не проверял.
Скачал программку, посмотрел, поигрался... Сначала понравилась, даже хотел прикупить.
Но после нескольких неудачных попыток сгенерить сложные вещи с использованием длинных переборов решил поискать что-то другое. Даже серверную версию.
Нашел soft.sepack.ru/random.php и "Генератор статей 'Навигатор.Статьи', версия 2.0".
И то и другое не понравилось. Первой нет проверки уникальности, а у второй вообще практически ничего нет.
За сим решил писать свой скрипт.
На данный момент скрипт может почти все то же, что и SEO Generator, кроме выбора метода генерации (использую свой) и поддержки переборов.
Зато написал свой алгоритм сравнения текстов "методом шинглов" (который планирую встроить в скрипт для отбора по заданному диапазону уникальностей). И как оказалось сгенерить более-менее беспаливный текст почти невозможно. Предложенная Hkey тулза (Hkey Shingle Text Compare) работает весьма грубо и часто не видит похожих текстов.
При текстах размером ~2,5К и длине шингла = 5 разница составляет ~13%. Тексты генерились SEO Generatorom, перемешивались и выбирались рандомом.
Думаю яндекс и гугл пользуются еще более сильными методами и находят нечеткие дубли еще лучше.
Я бы порекомендовал глянуть JsHttpRequest Димы Котерова http://dklab.ru/lib/JsHttpRequest/
+ знания PHP/MySQL/HTML/CSS/JS/mod_rewrite да и сам oscommerce знать бы не плохо ;)
Золотые слова! :) Сколько там развелось студентов-недоучек, готовых за $100 магазины "под ключ" клепать...
Вот это уж точно путь вникуда, если самому не быть хорошим программистом.
Конечно! Инет-магазин должен быть копией тех десятков тысяч невыразительных поделок с отвратительным описанием с одними и теми же ошибками в текстах и тем, что язык не поворачивается назвать дизайном - вот это точно путь к успеху! ☝
Anryk, прежде чем давать такие советы нужно самому поднять хоть один инет-магазин.
Если сразу обращаться в раздел коммерческих предложений с готовым ТЗ и НОРМАЛЬНЫМ бюджетом. Иначе с тем же, точнее с большим, успехом можно идти на фрилансер. Там студенты быстрее сбегутся... 😂
На самом деле даже там не так много настоящих спецов, а те, что есть - обычно уже заняты. И уж тем более на $300 никто из них не поведется ;)