gofman, джаваскриптовые тоже пробиваются... хотя 99.9% спамеров это отсеит (+10% пользователей у которых выключен джаваскрипт)
NWB, большинство спамилок - тупые. Они не проверяют роботс.тхт, нофолоу, и даже успешность спама. Большинство про спамеров регят пачками домены типа jf87hdb.com и обходят любые фильтры на слова. А если фильтровать по кейвордам, то к примеру забанив слово Алегра (название таблеток), ты одновременно забанишь и всех юзеров с таким именем (довольно популярным).
Vladimir_Rublin, я выше несколько методик писал.., и в вашем случае распознавание образов - лишнее. 1й курс института, теория вероятности. Дано: известно что ответ будет малой величиной в области от 0 до 10, известно что спамилка не имеет ответа но предлагает варианты со скоростью 100 ответов в минуту. Какова вероятность что правильный ответ будет найден в течении первых 10 секунд?
Насчет ввода кодовых слов - я подобные вещи обходяться на автомате, ИИ там не требуется.
Lor, многие програмеры тоже думают что этому можно научиться за пару месяцев.., а потом почемуто у них серваки не работают, все глючет, виснет и т.д. Хороших програмеров найти весьма трудно, и цены на их услуги бывают гораздо выше чем цены на услуги оптимизаторов ;)
Хотите уменьшить СТР и увеличить продажи - указывайте.
Хотите чтоб было больше кликов - убирайте.
Lor, читай http://ru.wikipedia.org/wiki/Когнитрон
greenwood, практика показывает что это оптимальный вариант. боты просто другими делами будут заниматься ;)
NWB, тут тоже не все гладко, так как если говорить о вебспаме на форумах\блогах в целом (а не только от дорвейщиков) то к примеру я, как владелец сайтов с большим трафиком, вынужден бороться со спамом через картинки и IM. В принципе все решаемо.., но модерирование все таки имхо лучший вариант.
Хех, определись для начала с терминологией... и говорите о себе, а не ситуации в целом:
>у вас нет технологии которая распознает текст при смене шрифта.
> у вас нет технологии которая может распознать любой текст.
>у вас нет технологии, которая может распознать набор символов.
>у вас нет технологии которая может распознать набор символов который может распознать человек.
А то из ваших слов выходило что системы распознавания образов, методы математического анализа, нейросети, неокогнитроны и т.д. наряду с файнридером и прочими OCR существуют лишь в восполенном воображении их пользователей и детей, которым еще не успели промыть мозги заявлениями о том что это невозможно. :-D
вывести можно. вопрос в сроках и финансах.
а на каком языке движок написан - неважно. оптимизировать можно все.
Lor, ты в отличии от меня - не программер. При простой смене шрифтов даже нейросети или ННМ не потребуется. :)
Если статьи интересные - возьму бесплатно.
Lor, я доказывать не буду, эт не в моих интересах. ;)
Я проще обьясню:
1. любая сложная проверка затрудняет интерактивность и уменьшает количество пользователей (и привлекательность ресурса) примерно на 30% (в зависимости от сложности).
2. Грамотно обученая сабмителка будет проходить проверки с точностью не меньшей чем у пользователя (другими словами - пользователи будут ошибаться чаще чем автомат).
3. Пользователь обычно бросает попытки добавить коментарий после 2й-3й ошибки, автомат может долбать до такой степени что правильные ответы будут являться результатом арифметической погрешности. При этом коряво написанный модуль проверки (к примерку если картинка генерируется в реалтайме) запросто положит сервак.
4. Среднестатистический школьник за 100-150рублей в сутки и 4 часа времени способен в ручную проспамить примерно 150 ресурсов. Причем он пройдет любые проверки, регистрации, и оставит более менее осмысленное сообщение которое на первый взгляд не будет выглядеть как спам.
Теперь оцени шансы создания автоматической системы антиспама которую невозможно будет пройти спамерам и взвесь реальные плюсы и минусы ее создания.
Я в свое время решил что потеря потенциальной аудитории недопустимая роскошь и гораздо более эфективно нанять за деньги несколько человек для мониторинга ресурсов, заодно они и с народом общаются.
Распознается все. Единственное что для того чтобы распознать капчу гугла или яхи может уходить около секунды процессорного времени, а на капчи типа рнрББ - сотые доли. Распознавание сложных образов, решение математических или лингвистических задач - все это при желании легко обходиться. А уж поведение юзера моделируется вообще элементарно.
Так что если у вас нет спама - не обольщайтесь, просто ваш ресурс недостаточно интересен для спамеров.
А вообще проблема решается отключением возможности добалвять ссылку (оставлять только текст) и (или) написанием собственного модуля проверки (или изменением названий всех переменных, имен файлов, и путей в стандартном) + убиранием всех сигнатур по которым вашу форму могут найти (типа "Быстрый ответ" , "Добавить сообщение" и т.д.)
Курить мануалы
<?php
disk_free_space();
?>