Estelle

Рейтинг
50
Регистрация
30.10.2012
response:
В целом, яша буксует который день, и вся суть проблемы была в том, что не каждый его ответ о собственной нетрудоспособности был корректно отлавливаем Магаданом. Это и приводило к выводу сообщения об ошибке классификатора.

А отчего он так буксует? Это часто с ним бывает? Извините, я в этом деле новенькая, но сегодня и в самом деле очень медленно процесс идет. И постоянно превышается таймаут, если только конечно выставить паузу по умолчанию 270 сек., но тогда совсем заснуть можно(((

Dasha_R:
Да хотя бы потому, что - кто там в лидерах опроса? Адвега и Етекст? Так эти ресурсы жестко конкурируют меж собой, не представляю их консолидированных действий по выявлению плагиата в сети. Разве что на условиях поглощения-изничтожения соперника :)

Вот это то и печально... Достаточно ведь почитать посты других пользователей с предыдущих страниц чтобы понять, что я не одна страдаю от таких недоразумений((( На всё это попусту тратятся время, силы и нервы. Я должна писать, а не убеждать недалеких заказчиков в абсурдности сервисов, нацеленных на какую-то свою выгоду(((

ЗЫ Мысли про себя: Эх, люди, люди, куда не ступит ваша нога - везде нажива(((

Dasha_R:
Единый ру-стандарт антиплагиатных требований эфемерен и недостижим.

А почему это он "эфемерен и недостижим"? Я же не призываю всех пользоваться одной какой-то программой (упаси Боже!) И к госстандарту никого не призываю... Просто есть такой четкий термин как шингл, который довольно внятно описан во многих авторитетных источниках. Вот только взгляды программистов на этот самый шингл почему-то несколько различаются. Но большинство из них все-таки придерживаются этого самого шингла. А когда кто-то заявляет, что изобрел "совершенно новый алгоритм проверки текста на уникальность", но не может почему-то объяснить (хотя вкратце) принцип его действия, то... это очень похоже на очковтирательство.

Вот Вы, Dasha, ведь читаете этот пост, который между прочим называется "Опрос. Способ проверки текста на уникальность. Кто чем пользуется". Значит и Вас чем-то трогает эта тема. Иначе Вы бы юзали (извините за жаргон:) хоть тот же текст.ру и не читали бы эту тему. Но как на ярмарке, правда? Чей товар лучше? Я между прочим пока что не проголосовала. Потому как пытаюсь понять эти все различия.

lesss:
Скорее всего дело в том, что тут размер шингла все же нельзя сравнивать напрямую. В etxt антиплагиат размер шингла равный 3 (в отличие от 4, 5 итд) обрабатывается особым образом - он не считает совпадением найденный одиночный трехсловный шингл (то есть если на расстоянии одного-двух слов от него рядом нет другого совпавшего трехсловного шингла). То есть на самом деле это получается некий промежуточный вариант между размером шинглов в 3 и 4.

Вот как иногда достают пререкания с заказчиками по поводу всех этих различий во вроде бы однотипных на глаз программах ! А вот еще 1 БОЛЬШОЕ недоразумение: /ru/forum/comment/11538641 и http://text.ru/text_check Просто интересно (очень!) мнение автора etxt Антиплагиат по этому поводу.

Dasha_R:
Тогда логично было бы ваши посты адресовать этим заказчикам, а не создателям текстру. Сервис действительно жесткий, но не шингловый - насколько могу судить по опыту собственных проверок.

Нет, я хотела бы адресовать эти посты не сколько создателям текстру, сколько КОНКРЕТНО ВСЕМ разработчикам подобных антиплагиатных программ и сервисов. Как Вы этого не можете понять?! Разве сложно прийти к какому-то одному стандарту (шингловому или не-шингловому - суть не так важно!)?! Чтобы не было уже раз и навсегда этих недоразумений! Заказчикам ведь наплевать на все эти шинглы, падежи, канонизацию и т.п.! Им подавай конкретную цифру в %!

А сервис не "жесткий", как Вы изволили выразиться, а попросту абсурдный!

TEXT_RU:
Да, у нас совершенно новый алгоритм проверки текста на уникальность.

В моем предыдущем сообщения шла речь о тех случаях, когда, к примеру, исполнители не потрудились качественно отрерайтить статью, а просто поменяли слова местами или кое-где изменили падежи. По сути это и не является рерайтом. У нас на бирже исполнители делают такой рерайт, что даже наша проверка уникальности выдает высокий процент.

Если на Вашей бирже работают писатели-фантасты и талантливые сказочники тогда я не сомневаюсь, что они делают ООООчень "качественный" рерайт!))) Только вот говорится ли в этих статьях хоть что-то похожее на реальность... Вот в этом я уже сильно сомневаюсь...

PS Я здесь уже много чего понаписала по поводу этого "совершенно нового алгоритма проверки текста на уникальность"))) Может быть слишком язвительно даже. Но автор-разработчик молчит в ответ, а это значит лишь одно: ему возразить нечего!

Такие биржи как ETXT, Advego & Miralinks (и конечно же их программы и онлайн-сервисы) существуют уже достаточно давно и имеют хорошую репутацию. Вот что на это возразил бы Text.ru? Но ответа я похоже не дождусь:)

---------- Добавлено 12.03.2013 в 20:51 ----------

Dasha_R:
Estelle, вас кто-то заставляет пользоваться текстру?
К чему столько воинственного пафоса?

Я себя не заставляю, конечно. Я еще с ума не сошла. Но некоторые заказчики, которые сами даже не понимают сути работы подобных программ, а только где-то слышали слова вроде Advego Plagiatus (а теперь и Text.ru!) кивают на этот Текстру новомодный: мол, ты Эстель, что-то поисписалась... Абыдно, да?))((

TEXT_RU:
gtauter, у нашего сервиса не шингловый алгоритм проверки...

Что касается вопроса о минимальном проценте уникальности, то для текстов со строительной, юридической и др. подобными тематиками (где много устойчивых фраз и выражений, которые никак нельзя перефразировать), нормальна уникальность от 80% и выше. В остальных случаях нормальна уникальность 95-100%

ОК! Вот а предположим документально-историческая статья... Ваш хваленый алгоритм нашел в моем рерайте к примеру такие совпадения: "журнал "Кругозор" - газетой "Известия" его изволите обозвать для качественного рерайта?)))) Далее: "издательство "Правда" (заменим на "выпускательство "Истина"!)))) Ещё пример: "Лев Кассиль" - да пусть он будет Васей Пупкиным, главное чтобы текст уникальный был! Или вот "Совет Министров СССР по радиовещанию и телевидению" - это Вы, Уважаемый, как бы переделали?)))) Впрочем, я уже догадываюсь)))

Находит совпадения минимум в 2 слова (очень похоже на мазохистский 2-хсловный шингл), которые и не изменишь никак и не подберешь к ним синонимы, потому как это выглядеть будет дико!

TEXT_RU:
Да, у нас совершенно новый алгоритм проверки текста на уникальность.
У нас на бирже исполнители делают такой рерайт, что даже наша проверка уникальности выдает высокий процент.

Безумно интересно узнать на чем же это основан этот Ваш "совершенно новый алгоритм"! И каким это образом Ваша "проверка уникальности выдает высокий процент"! Как говорится "каждый кулик свое поле хвалит"!))) Да будет ли известно Вам, Уважаемый, что даже само понятие "шингл" у разных программ антиплагиата (Etxt Antiplagiat vs Advego Plagiatus) трактуется немного по-разному - отсюда и некоторое различие в % уникальности при ОДИНАКОВОМ размере шингла! Шингл - это математика т.к. в данном случае вычисляется контрольная сумма текста, а с точными науками сложно спорить, не так ли? А на чем основан Ваш "совершенно новый алгоритм"? На интуиции? Или на гадании на кофейной гуще? Извините за ехидство, но я тоже могу заявить, что изобрела "совершенно новый алгоритм", не объяснив толком его сути!

---------- Добавлено 06.03.2013 в 20:00 ----------

Estelle:
Безумно интересно узнать на чем же это основан этот Ваш "совершенно новый алгоритм"! И каким это образом Ваша "проверка уникальности выдает высокий процент"! Как говорится "каждый кулик свое поле хвалит"!))) Да будет ли известно Вам, Уважаемый, что даже само понятие "шингл" у разных программ антиплагиата (Etxt Antiplagiat vs Advego Plagiatus) трактуется немного по-разному - отсюда и некоторое различие в % уникальности при ОДИНАКОВОМ размере шингла! Шингл - это математика т.к. в данном случае вычисляется контрольная сумма текста, а с точными науками сложно спорить, не так ли? А на чем основан Ваш "совершенно новый алгоритм"? На интуиции? Или на гадании на кофейной гуще? Извините за ехидство, но я тоже могу заявить, что изобрела "совершенно новый алгоритм", не объяснив толком его сути!

Цитата с Вашего сайта "....наш алгоритм обнаруживает плагиат и после перестановки слов, фраз и предложений местами". Выставив шингл равный 1 или хотя бы 2 такое и получите.

---------- Добавлено 06.03.2013 в 20:23 ----------

Так и есть: вставила для пробы 1 свой рерайт в text.ru - выдал очень низкий процент уникальности, но всё очень похоже на крайне малый размер шингла - только и всего!))) Вот что я хочу сказать, господа разработчики: Качественный уникальный контент - дело ОЧЕНЬ серьезное, так что пора уже приходить к какому-то ЕДИНОМУ стандарту определения этой самой уникальности, а не выдумывать "совершенно новые алгоритмы", пытаясь обскакать конкурентов! А мы, писаки уж как нибудь под этот единый стандарт да подстроимся - это уж не беспокойтесь!)))))

TEXT_RU:
gtauter, у нашего сервиса не шингловый алгоритм проверки, соответственно, он может находить те тексты, в которых был изменен порядок слов, фраз и предложений, и в которых были изменены грамматические формы слова. Некачественный рерайт или копирайт, который возможно будет иметь 95% уникальности, полученный путем проверки с помощью шинглов, невысоко котируется ПС при ранжировании сайтов.

Извините, но я что-то не поняла: есть еще какой-то другой, отличный от шинглового, алгоритм проверки? Правда, первый раз слышу! Да и как мне известно, большинство тружеников бирж контента именно таким образом обрабатывают тексты, как вы тут описали! И что теперь, ПС низко оценивают те сайты, на которых их контент размещается? Похоже, что Вы просто неудачно пошутили:)

webrock:
не обязательно. просто подбираете НЧ не брезгуя даже от 50 запросов в месяц, пишите
контент с заголовком точного вхождения по ключику и получаете трафик, если конечно статья написана хорошо.

НЧ не продвигают ссылками, его дарят ПС бонусом, разумеется, зависит от конкурентности тематики и перелинковки внутри, по ключам.

на самом деле, этого НЧ, хоть завались в рунете, был бы контент ...

берёте, к примеру, НЧ из статы нужной вам ПС, загоняете в поиск и в топе смотрите что выделяется жирным ... и так по убывающей... тогда оно будет понятнее, кто и с чем позиционирует в выдаче.

далее просматриваете топовиков, делаете текст лучше, публикуете и так ... стэп бай стэп ...

А что, вот это мне, пусть и дилетантке кажется уже ИСТИНОЙ! Очень хорошо все расписано.

---------- Добавлено 03.03.2013 в 01:12 ----------

И всё же вопросы, вопросы, вопросы! Нет им числа!

Вообще меняется ли само определение "частотность поисковых запросов" с течением времени? Ведь количество пользователей Интернета растет с каждым днем и реальны ли сейчас те цифры, что например, приводятся в вики Вебэффектора? Ведь те статьи были написаны вроде как еще в 2011 году. То есть, к примеру, не устарел ли показатель СЧ-запросов от 1000 до 10 000 раз в месяц?

Известно, что часто люди вводят в поиск нужное им слово, забывая переключить раскладку клавиатуры. И, например слово "мода" получается как vjlf. Статистика Яндекса, естественно подобные случаи тоже учитывает. Так вот, наверно следует при анализе собранных ключевиков суммировать мода и vjlf?

Или вот еще пример:

жизель бундхен 10307

жизель бюндхен 1267

Суммировать эти 2 цифры нужно?

И потом: какие вообще могут быть ПОКАЗЫ рекламных объявлений(!) в выдаче Яндекса по подобному запросу (здесь уместно следовать логической цепочке "мода" – "топ модели" – "жизель бундхен")? Там ведь по запросу "мода" в основном реклама различных интернет-магазинов одежды показывается, что более чем логично. Т.е. вроде понятно, что люди, искавшие инфу по слову "мода" искали еще и "жизель бундхен", но какие могут быть ПОКАЗЫ рекламы этой самой Жизели?!

Короче, мое дилетантское заключение таково: с этим Вордстатом больше недоразумений и в плане определения частотности запросов полезен он и в самом деле только для рекламодателей. А простым смертным, просто дающим людям какую-то информацию, остается лишь узнавать ассоциации запросов!

Всего: 85