- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Базу Пастухова берите, там уже все давно отпарсено )))))
А у Пастуховской базы разве по РАмблеру статистика есть?
Что-то я то же не вижу там статистики Бегуна.
Stripe добавил 08.12.2008 в 16:19
На счет базы Пастухова, я ошибся, там нет статистики Рамблера, а не Бегуна.
Частоту по Рамблеру можно собрать Язлом (yazzle): прокси, задержки - все есть:)
инструменты - сайт - оценка посещаемости по списку запросов, после отработки программы - в столбце "показы по рамблеру" будет частота, но показывает Yazzle только количество показов первой страницы результатов поиска для запроса, а не всех страниц.
site-auditor (обновленная версия) показывает позиции по рамблеру, яндекс и гуглу плюс комплексный анализ сайта. Плюсы проги - бесплата. минусы - врет на пару тройку позиций.
а накой нам позиции? =)
Просили парсилку, полльзуйтесь... :)
Для того, что бы скрипт работал, надо в php.ini раскомментировать строку: extension=php_tidy.dll
Выдает массив ($parse) массивов по два элемента:
1-й - ссылка на найденный сайт
2-й - Текст, который в выдаче прилагается к ссылке
Если, что не понятно, задавайте вопросы...
freeneutron добавил 13.12.2008 в 15:47
Еще, если в предидущем примере сделать замену
"file_get_contents" -> "get_contents"
и добавить к нему такую функцию
то с помощью последней можно задействовать всю мощь библиотеки Curl. Например, в параметре, $proxy, который поумолчанию отключен, можно передать имя или IP промежуточного прокси-сервера, в формате IP: port или name: port.Я не сразу понял, что написал скрипт не для той выдачи, о которой в топике шла речь. :) Но с помощью этого примера можно парсить любую выдачу. Главное правильно подобрать цепочки (child[4]->child[1]->)
Надо ещё куки запоминать, курл умеет.
Надо ещё куки запоминать, курл умеет.
А это с какой-то хитростью связано? Не могу, посмотреть, что это за хитрость, то есть не могу зайти в
https://ad.rambler.ru/swrds/
Ведь речь про него ?
А это с какой-то хитростью связано? Не могу, посмотреть, что это за хитрость, то есть не могу зайти в
https://ad.rambler.ru/swrds/
Ведь речь про него ?
там авторизация.. используется механизм сессий (как он в ПХП называется). В урлах данных о сессии нет, значит в куках авторизация и сессия сидит.
А без авторизации больше сотни слов в день сложно чекнуть. С авторизацией у меня получается около 70 штук за 5 минут.. Вручную.