shagy74

cleantalk.ru

Рейтинг

Регистрация

03.10.2013

Интересы

Soft, family, activities

Скрипты защиты сайта от спама PHP,Perl,Python, .NET

4 октября 2013, 04:31

Евгений Комиссаров:
А ложных срабатываний у вас сколько? Какой минимальный размер постов обрабатываете? Люди говорят всякое про sentiment analysis, например что эффективность 60-70% (против 50% у научного тыка) на коротких текстах.

Евгений, эмоциональный анализ не используем, для оценки релевантности применяем поиск совпадения по ключевым словам и тематике слов. Функция включается для сообщений с 12тью и более ключевыми словами в тексте.

Общий уровень false/positive (по всему сервису) ниже 0.01%, вчера был 0.0009%.

---------- Добавлено 04.10.2013 в 09:38 ----------

ivan-lev:

Вся проблема в том, что как только "профессиональный скрипт" пойдёт в массы, найдутся умельцы, которые массово на автомате сделают обход этого скрипта. А "собственные решения" напоминают того самого Неуловимого Джо - зададутся целью - обойдут/поломают/заддосят.

Скрипты являются клиентской частью сервиса, большая часть логики находится на серверах, поэтому время устранения уязвимости минимально, 2-3 часа как правило.

Насчет собственных решений, они требуют обслуживание, подкрутку, проверку и прочее, т.е. при той же или даже меньшей эффективности дороже стоят для владельца сайта.

Кстати, то что мы предлагаем никто не мешает совмещаться с собственными решениями, тут важно держать себя в руках и не отбить желание у посетителя сайта регистрироваться/постить накрутив 10 методов защиты от спама :)

Скрипты защиты сайта от спама PHP,Perl,Python, .NET

3 октября 2013, 12:30

izbushka:

Естественно. В таком случае вам никакая защита не поможет. Вы никак не отличите такой броузер от реального. Нужно будет принимать другие меры: например, фразеологический анализ контента, каптчи и прочее, вызывающее трудности у ботов.

PS. я так понимаю, этот топик ради рекламы? :)

100% фильтрации ботов (с вероятностью фильтрации живого человека ~ 0.01%) можно добиться используя несколько проверок одновременно, к примеру - JavaScript тест, тест времени заполнения формы, проверка по черным спискам (IP, Email, домен продвигаемого сайта), релевантный анализ текста.

Релевантным анализом текста, кстати, можно и ручной спам фильтровать (ну или офтопы, кому как нравится), здесь можно добиться эффективности в 92-96%.

Топик немножко ради рекламы, а по большей части чтобы узнать требуется ли народу профессиональный скрипты, или устраивают собственные решения?

http://cleantalk.ru

Переиграть и победить: как анализировать конкурентов для продвижения сайта

Вышел новый Яндекс Браузер с YandexGPT и YandexART

shagy74