- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи
И выявили более 7 млн подозрительных пользователей
Оксана Мамчуева
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
задержка 1 сек, вместо крона использовал свою программу
буквально через минуту работы скрипта схватил бан, до сих пор не разбанен. Проксей нужно будет ОЧЕНЬ много чтобы собрать что-то внятное.
Я так ни когда не наглел :))) Или пачка проксей, или пачка хостингов вас спасут.
ура меня разбанили на
http://stat.yandex.ru/queries/last20.xml
Думаю с задержкой в 1 сек действително погорячился, и жадность как говорят сгубила :)
радует что:
1. Бан не вечный и недолгий (1-2 часа)
2. Прокси не нужны/ нужны немного (10-20 можно найти)
буду эксперементировать с частотой граббинга (думаю раз в 10-30 сек можно ставить на ночь и сутра получить большую базу)
РАБОТАЕМ ДАЛЬШЕ :)
Кроме как ловля свежеиспечённых ВЧ-запросов на ум ничего не приходит ;( Ну, т.е. если вдруг все ломанутся искать что-то новое.. или там новости на какую-то тему.
Но опять же надо успеть довольно быстро сбацать на эту тему сайт и, к тому же, продвинуть его ;)) А апдейты и индексации не так чтобы сильно зачастили.
Я использую для сбора баз и еще для одной темы, но об этом вслух говорить не стану :)
Обновлен парсер прямого эфира Яндекса. Теперь он парсит через прокси, прокси берет с текстовика, который лежит где-то у вас на сайте.
Адрес текстовика с вашими прокси вы можете задать на 18 строке. Каждая прокси в формате адрес:порт должна бать с новой строки.
Забираем парсер.
ЗЫ: Если вам необходимо будет брать брать список прокси из текстового файла с вашего компьютера, обращайтесь, сделаю и такую версию.
Спасибо за инструмент! А цель - банально сбор базы запросов Яндекса, а дальше уже область применения широкая, на сколько фантазии хватит:)
Да не за что, пользуйтесь :)
Привет. Установил программу на сервер, залил базу. Поменял в файлах имя пользователя базы, пароль, и файл к прокси. Но чего-то не работает. После запуска файла пустой экран. В базу ничего не добавляется. Плиз хелп. Спасибо.
В строчке 66 отсутствовали кавычки... ))
Еще одна ошибка Fatal error: Call to undefined function iconv() in....
Юзаю FirstVDS
блин, что то не понятна практическая ценность этого парсера, не могли бы пояснить?
Для быстроты работы я бы еще построил индексы:
А то далеко не уедет скрипт. На 100000 где-то уже тормоить безбожно будет.
SplashS добавил 27.01.2010 в 23:13
Еще одна ошибка Fatal error: Call to undefined function iconv() in....
Нужно установить расширение для PHP mod_iconv.
Обратитесь в саппорт хостера или покрутите панель управления - может быть модули можно оттуда включить.
Ну и еще вариант:
Изменить строку
Вот так:
Тогда в базу будем писать сразу в юникоде.
Ну и базу надо создать в юникоде и писать туда так же.
В sql файле надо писать
В bd.php: