choiz

choiz
Рейтинг
73
Регистрация
03.07.2007
Vanich:
Могу еще порекомендовать изначально составлять статьи так, чтобы в них можно было производить замену местами абзацев (анализ ситуации по нескольким независимым критериям, перечисление вариантов чего-либо и т.п.) и активно использовать втроенную в программу возможность перестановки местами абзацев.

само собой, это тоже делаем...

Топчег:
Как вы генерируете? просто заменой синонимов? статьи изначально уникальные или копипаст?

Конечно-же уникальные, мой копирайтер пишет статью и затем по делает по три рерайта каждого предложения. В итоге каждое предложение получается в 4-х вариантах. Затем идет моя работа, вот пример генерации:


{{Следует|Стоит|Нужно} принять {во внимание|к сведению}|Примите {во внимание|к сведению}}, что под {термином|понятием} «расходы» {понимаются|подразумеваются|имеются ввиду|предполагаются} не только {лишь|} {{денежные|финансовые} {траты|затраты|платежи|платы} {как таковые|}|{прямые|} {денежные|финансовые} {траты|затраты|платежи|платы}}, но {и|еще и|и еще} экономия на [+ и +{пере{квалификации|подготовки}|повышении {уровня|} квалификации}|обучении] {сотрудников|персонала|штата}, а также {по {целому|} ряду {других|остальных|дополнительных} организационных {моментов|вопросов}|по {другим|остальным|дополнительным} {организационным|} вопросам}.{<br><br>|}
Vanich:
Есть сведения, каким образом проверяются на неуникальность статьи в этой бирже?

К сожалению нет, несколько раз пытался у них выспросить, но они деликатно уходят от ответа. Миралинкс классная система, и меня мало интересуют другие. Галина Райцина в своем интервью сказала, что они борятся с размножением статей, поэтому думаю что со временем будет еще труднее...

Vanich:
А что мешает нагенерить побольше статей, и выбрать из них самые уникальные? В этом режиме сравнивается каждая с каждой. Использовать шингл 4 словный, как у сетевых проверялок уникальности. Текущие возможности программы позволяют создавать действительно уникальные для машинной проверки статьи

Пробовал, из 3000 статей при 6 словном шингле добился нулевого процента сходства, но осталось лишь 30 статей, из которых 20 приняли в миралинкс, а остальные отклоняют, а если бы был 4 словный, то 15 получилось бы, наверное.

Vanich, если несложно расскажите более развернуто, как добиться наибольшей уникальности. Оптимальное количество вариантов предложения, меню "генерация статей" и т.д., ведь в мануале все довольно кратко...

Из первого размноженного проекта миралинкс у меня принял 20 статей, из второго и третьего по 10. Затем модераторы стали отклонять статьи по причине неуникальности. Во всех проектах код был очень грамотным - заменялось и вертелось всё, что только могло, но попарное сравнение статей всё-равно дало о себе знать.

Vanich, скажите не планируете ли Вы сделать сравнение статей каждой с каждой, а не попарно? Причем лучше это реализовать на этапе генерации статей. Думаю это последний важный недостаток Вашей программы и очень хотелось бы чтобы он был исправлен.

Кстати, если кому-то нужно поменять расширение статей, например из .htm в .txt то это можно сделать вот как:

Создаете текстовый файл следующего содержания


ren *.htm *.txt

exit

затем даете этому файлу расширение .bat, помещаете его в директорию со статьями и там запускаете его.

wladvlad:
и толку от этих новых страниц и ссылок, если серпы стоят как вкопанные?

толк есть для тех кто ссылками барыжит, а так согласен - последние три АПа всё на месте, что в общем-то не радует

Vanich:

Введено опознавание урлов, теперь программа при корректировке правописания не сделает из "money.yandex.ru" "money. Yandex. Ru".

А не введено опознование сокращений типа и т.п., и т.д. и др.?

Vanich, отправил Вам на почту код протекции за вторую лицензию.

Программа мега-супер! Иван, дай Бог Вам здоровья и {красавицу|умницу} жену :)

Nata:
Уважаемый автор, а будет ли сделана возможность отката действия по "Ctrl+Z"?

Она есть, только работает в английской раскладке.

БаксБани:
Интересует тест размножения 1-й статьи,
п.с. моя статья - ваш размноженный вариант
асикью - семb O пятЬ З I B В

Здесь вообще-то не услуги по размножению статей обсуждаются, а программа. Для Вашей цели существует копилансер

234sha:
по читаемости возникают проблемы когда присылают 30-40 ключей, это довольно сложно все всунуть в текст и оставить при этом читаемым, особенно ключи вроде "купить дом Москва", купить дом Москва срочно" как не вставляй но тут будет резать глаз такая фраза. В любом случае мы стараемся увеличивать качество.

у меня было всего 4 ;)

234sha:
процент схожести 2-5 % на 350 статей, как правило, при размере шингла 10.

Сравнил 10 текстов из предоставленного отчета, данные цифры соответствуют действительности. Качество написания и читабельности статей конечно оставляют желать лучшего. Средний возраст доменов площадок 1 год. Пузомерки в основном маленькие, но не все. Через полтора месяца отпишусь как прогон повлиял на ссылочное ранжирование, но уже сейчас можно сказать, что услуга действительно стоит своих денег.

Всего: 75