Как вариант. Именно так.
Тогда: http://99webtools.com/php-whois-script.php
А теперь где взять базу IP масок для отделения котлет от мух.
Попробуйте вот так:
Если нужен полнотекстовый поиск
Для точного поиска по коллекции
http://www.php.net/manual/en/mongo.sqltomongo.php
http://docs.mongodb.org/manual/reference/sql-comparison/
Оформите в класс нужные вам функции и все получится.
Публика всегда более эффективна в поисках багов, чем обычные программисты, которые и так постоянно тестирую написанное.
Все равно найдется какой-нибудь хакер, который найдет критическую уязвимость! А скорее всего их такими сообщениями завалят.
В таком случае все решается приватными проксями. Но какова цена этого парсинга. Приватные прокси сейчас не дешево стоят.
Я бы посоветовал копать в сторону определения, реальный это заход с браузера или это socks, curl ..
Это можно определить считывая ряд параметров JS, получение информации с SWF или хеширование в localstorage. Все другие параметры идентификации могут работать не корректно.
Как простой пример http://toolster.ru/about_browser
Попробуйте повторить эти параметры при среднестатистическом парсинге на php или perl.
Цель понять, браузер это или бот, передать хеш и на основе хеша показывать страницу или нет. Имхо хороший и дешевый вариант защиты.
Вот такой способ поможет побороть спаммеров малой кровью. Решение в одну строку.
А вот если друзей много соц. сети, будет ли это считаться? :-)
позвоните в яндекс, спросите можно ли получить жителю Крыма карту яндекса..
Соглашусь. Только Я.ру неплохо было бы повступать в ТОП-20 сообществ и отписать комментов, в том числе и в сообщества яндекса.
Я.ру работает, но для нормального эффекта я бы посоветовал несколько аккаунтов + подключить feedburner сайта.
проводил такой эксперимент: купил 50 акков яру и все подписал под низкочастотники, к каждому подключил по твиттеру и залинковал rss сайта с twitterfeed.com
омлет, но получилось отменно ☝ каждая статья сопровождалась 50ю твитами и 50ю постами в яру. в twitterfeed можно в параметрах выставить окружение вокруг ссылки, там рекомендовано впилить низкочастотники.
Если еще актуально, то какая цена вопроса?
Можем помочь быстро, многопоточно спарсить информацию без блокировок. Механизм отлажен.
ЛС.