Каким образом можно скопировать все адреса сайтов из лайвинтернет?

12
I0
На сайте с 14.10.2006
Offline
142
#11

Нужно парсить имеено домены и поставить $i <= 100.

Напишите на форум php программистов, вам помогут.

Анализ сайта ( https://pr-cy.ru ) Проверка позиций - LINE ( https://line.pr-cy.ru ) 0,025 Р / ключ (конкуренты бесплатно)
TOBBOT
На сайте с 04.11.2014
Offline
41
#12
limyh:
Мы русские, должны друг другу помогать)) За спасибо-спасибо))
Может это делается быстро на коленке. И вам лучше.. опыта наберетесь))

Готово!

Скачайте модуль здесь

Скачайте программу TOBBOT и закиньте распакованный архив в директорию modules/ программы.

При формировании задания нужно указать номера страниц, которые нужно спарсить, и файл для сохранения результата.

Инструменты интернет-маркетинга - JLAB (http://jlab.io/) Бесплатная автоматизация с программой TOBBOT (http://tobbot.com/)
I0
На сайте с 14.10.2006
Offline
142
#13
limyh:
Со скриптами дело не имел.
Погуглил.
Подскажите правильно ли делаю
Часть 1.
1. Скачал-установил Denwer
2. Запустил Денвер
2: Зашел на новый виртуальный диск Z.
3: Зашел в папку home.
4: Создал свой папку: test
5: Зашел в эту папку и создал в ней папку с именем www.
6: В папке www создал файл index.php в котором записал этот код, который вы прислали
7: Перезапустил Denwer
8: В браузере открыл ссылку: http://test/index.php

жму Enter и в этой вкладке начало "что-то парситься" (ДО ЭТОГО МОМЕНТА (первую часть-подготовку) ВСЕ ПРАВИЛЬНО ДЕЛАЮ)???


(привожу скриншот того, что парсилось, начиная с самого начала:
http://dl3.joxi.net/drive/0003/1207/206007/160121/cfb508998e.jpg

Через некоторое время(прошло кажется секунд 20-30) "парсинг остановился"
В этой же вкладке в самом конце появилась такая строчка

Fatal error: Maximum execution time of 30 seconds exceeded in Z:\home\test\ on line 3
что это?

<?php


for ($i = 1; $i <= 10; $i++) {

$lines = file('http://www.liveinternet.ru/rating///today.tsv?page='.$i, FILE_IGNORE_NEW_LINES | FILE_SKIP_EMPTY_LINES);
array_shift($lines);
foreach ($lines as $line) {
list(, $domain) = explode("\t", $line);
print $domain . "<br>\n";
}
}
?>

$i = 1; — номер первой страницы

$i <= 10; — номер последней

Bitman
На сайте с 05.07.2009
Offline
112
#14

У меня завалялось с давних пор. С определенных категорий выдернуть сайты. [ATTACH]148434[/ATTACH]

zip parser-domains-liveinternet.zip
Северный лес (https://euro-vagonka.by) DREW (https://drew.by) AvtoDrive (https://avtodrive.by)
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий