cntos

Рейтинг
19
Регистрация
25.04.2006

А зачем писать, что это генератор уникальных текстов, если он таковым не является?

Это скорее генератор с анализатором похожести. Вот если бы он мог по заданному (в %) диапазону похожести отбирать тексты сразу при генерации...

И очень нехватает тонких настроек (исправление ошибок, сравнение и т.д.).

Вобщем, похоже, нужно дописывать свое, т.к. в сети не нашел ни одного нормального/вменяемого/удобного генератора с отбором.

А программа генерирует максимум 49999 и переборы идут с конца - поэтому так и получается, что переборы в начале остаются нетронутыми.
И все полученные строчки (49999) - уникальны.

Уникальны они только при простом сравнении, но далеко не уникальны для поисковиков, для которых вобщемто все и делается.

Многим в основном, если я не ошибаюсь, нужны не десятки тысяч и даже не тысячи вариантов с неизвестным процентом похожести, а десятки-сотни вариантов с определенной степенью похожести.

Вобщем пока юзаю программу только для написания формул из-за удобной подсветки синтаксиса.

У меня почему-то программка неправильно генерирует - первые несколько слов (в зависимости от размера текста) во всех вариантах остаются одинаковыми.

Пробовал множество разных формул - результат тот же.

--дубль-удален--

хмм.. к сожалению, не видел Вашего скрипта.. но очень интересно потестить.. если скине его мне - буду признателен и о результатах теста обязательно отпишусь..

Он пока в сыром виде - просто набор ф-ций и их ручной вызов с ручными же параметрами. В общем неюзабелен он пока, хотя и работает.

Давайте лучше я прогоню через него несколько случайных вариантов статьи и сверю с оригиналом. Цифры выложу сдесь.

по теме: практически уверен, что склеить результаты рерайта для любого поисковика - достаточно проблематично.. И дело не в количестве процентов отличий по той или ной программе. дело в том, что тексты, тупо, разные..

Я тоже так думал. Но проверка методом шинглов показывает обратное - найти нечеткие дубли - вообще не проблема. Другой вопрос - как его используют поисковики? Для работы с такими объемами информации они производят кластеризацию и сравнивают не каждый шингл, а супершинглы... тут, конечно, могут быть погрешности и весьма большие.

И, если честно, не совсем понял, к чему Вы? к тому, что рерайт - это не вариант, надо разные статьи у копирайтеров заказывать? если Вы об этом - я с Вами полностью согласен. только есть 1 но: деньги.

Я не хотел делать каких-либо окончательных выводов. А хотел понять насколько реальна возможность генерации текстов по формуле, чтоб поисковики их не склеивали.

Если Вы говорили о том, что ручной рерайт лучше - опять же - в чем-то соглашусь.. но дааалеко не во всем.. разница, имхо, только в том, что ручной копирайтер может переставлять мысли (читай - предложения или абзацы) местами.. но и тут есть выход:

Ручной лучше - но мне он не интересен по многим причинам.

Предложения и абзацы можно менять сколько угодно, но методом шинглов, в большинстве случаев, это вскрывается.

Интересно было бы услышать отзывы тех, кто переписывал себе страницы подобным образом. Как к ним отнеслись Я и G?

проанализировал несколько рендомных статей (из последних моих работ) с помощью Altalabs.ru/files/Shingles.rar - результат самого порадовал: от 0 до 3х процентов схожести текстов.. редко-редко встречаются экземпляры, где данный процент больше.. Как пример: ковырял 2 заказа (2000 статей) часа 2, пересмотрел не одну сотню вариантов.. по 4 раза встретил 4х и 5ти% схожесть, 1 раз - 6ти, все остальные варианты - 0-3%.

Я то же этой тулзой проверял, пока не написал свой скрипт проверки.

Меня удивила эфективность нахождения нечетких дублей методом шинглов. В отличии от этой утилиты дублю скрыться почти невозможно. По крайней мере у меня не получилось сгенерить тексты (>2К) со степенью похожести менее 3%. Ни чем не получилось.

По этой формуле:

{Еще {один|} {нюанс|момент}{ хотелось бы {оговорить|озвучить|уточнить}|}|Есть еще одно замечание|Хотел бы {озвучить|оговорить|уточнить} еще {один|} ...........

сгенеренный с помощью SEO Generator текст имеет сходство с оригиналом в среднем на 6,7%. Провел 10 сравнений с оригиналом и получил такие цифры (похожесть в %): 7/11/8/0/7/7/3/0/3/21.

Vaster, быть может вы привели не самую удачную формулу, может у вас есть несколько десятков вариантов сгенеренного текста с похожестью 0-3%? Я бы прогнал своим скриптом, а то я как-то разочаровался в методе... :(

осталось только Яндексу угодить

В том-то и дело... Сгенерил одну страницу из растиражированной в инете и заменил на своем сайте. Через несколько дней гугл обновил страницу с новым текстом. Но положение страницы так и не изменилось.

Сдается мне, что гугль легко отлавливает такие дубли... Насчет яндекса пока не знаю, не проверял.

Скачал программку, посмотрел, поигрался... Сначала понравилась, даже хотел прикупить.

Но после нескольких неудачных попыток сгенерить сложные вещи с использованием длинных переборов решил поискать что-то другое. Даже серверную версию.

Нашел soft.sepack.ru/random.php и "Генератор статей 'Навигатор.Статьи', версия 2.0".

И то и другое не понравилось. Первой нет проверки уникальности, а у второй вообще практически ничего нет.

За сим решил писать свой скрипт.

На данный момент скрипт может почти все то же, что и SEO Generator, кроме выбора метода генерации (использую свой) и поддержки переборов.

Зато написал свой алгоритм сравнения текстов "методом шинглов" (который планирую встроить в скрипт для отбора по заданному диапазону уникальностей). И как оказалось сгенерить более-менее беспаливный текст почти невозможно. Предложенная Hkey тулза (Hkey Shingle Text Compare) работает весьма грубо и часто не видит похожих текстов.

При текстах размером ~2,5К и длине шингла = 5 разница составляет ~13%. Тексты генерились SEO Generatorom, перемешивались и выбирались рандомом.

Думаю яндекс и гугл пользуются еще более сильными методами и находят нечеткие дубли еще лучше.

Я бы порекомендовал глянуть JsHttpRequest Димы Котерова http://dklab.ru/lib/JsHttpRequest/

+ мозги

+ знания PHP/MySQL/HTML/CSS/JS/mod_rewrite да и сам oscommerce знать бы не плохо ;)

Студенты конечно сделают на фрилансе и веблансере, но мой Вам совет - не торопитесь - соберите нормальный бюджет на проект и будем вам счастье :-)

Золотые слова! :) Сколько там развелось студентов-недоучек, готовых за $100 магазины "под ключ" клепать...

Возьмите готовый инет-магазин, хоть платный, хоть бесплатный, и купите к нему шаблон (дизайн). С разработкой не связывайтесь, путь в никуда.

Вот это уж точно путь вникуда, если самому не быть хорошим программистом.

Она (разработка) нужна только, когда необходимо что-то исключительное и неповторимое , интернет-магазин к такому не относится.

Конечно! Инет-магазин должен быть копией тех десятков тысяч невыразительных поделок с отвратительным описанием с одними и теми же ошибками в текстах и тем, что язык не поворачивается назвать дизайном - вот это точно путь к успеху! ☝

Anryk, прежде чем давать такие советы нужно самому поднять хоть один инет-магазин.

forum.oscommerce.ru - тамошние обитатели соберут что угодно на базе oscommerce

Если сразу обращаться в раздел коммерческих предложений с готовым ТЗ и НОРМАЛЬНЫМ бюджетом. Иначе с тем же, точнее с большим, успехом можно идти на фрилансер. Там студенты быстрее сбегутся... 😂

На самом деле даже там не так много настоящих спецов, а те, что есть - обычно уже заняты. И уж тем более на $300 никто из них не поведется ;)

Всего: 66