нужен парсер картинок

Alboy
На сайте с 31.01.2010
Offline
52
1291

Нужен парсер картинок с sima-land.ru по списку url, (адреса url в списке типа https://st-sima.r.worldssl.net/items/1284543/0/400.jpg так чтобы картинка сохранилась с именем 1284543.jpg) количество url около 40000, подскажите, может есть готовая программа, которая может так сделать или может кто-то возьмётся написать. Если кто-то возьмётся написать - укажите сколько это будет стоить.

K0
На сайте с 01.09.2016
Offline
66
#1

Операционная система?

Список картинок уже есть или еще надо откуда-то парсить? Если есть, то в чем хранится?

realefs
На сайте с 27.06.2010
Offline
87
#2
Alboy:
Если кто-то возьмётся написать - укажите сколько это будет стоить.

<?php

error_reporting(E_ALL);
ini_set('display_errors', 1);
set_time_limit(0);
header('Content-Type: text/html; charset=utf-8');
$array = file('links.txt', FILE_IGNORE_NEW_LINES);
for ($i = 0; $i < count($array); $i++) {
preg_match('/(?<=items\/).*?(?=\/)/', $array[$i], $name);
file_put_contents("$name[0].jpg", file_get_contents($array[$i]));
}

?>

держи говнокод

в каталог со скриптом положить файл links.txt в нем построчно урлы к картинкам. пыкчи будет сохранять в каталог со скриптом.

Рубероид дорожает.
Alboy
На сайте с 31.01.2010
Offline
52
#3

выскакивает ошибка

Parse error: syntax error, unexpected '*' in /var/www/admin/www/мой.сайт/333/1.php on line 8

адреса немного другие с перенаправлением

https://st-cdn.r.worldssl.net/items/562/562383/0/700.jpg

https://st-cdn.r.worldssl.net/items/111/1115596/0/700.jpg

https://st-cdn.r.worldssl.net/items/622/622812/0/700.jpg

https://st-cdn.r.worldssl.net/items/622/622813/0/700.jpg

https://st-cdn.r.worldssl.net/items/115/115005/0/700.jpg

realefs
На сайте с 27.06.2010
Offline
87
#4
Alboy:
выскакивает ошибка

на регулярку гавкает. вот немного измененная

<?php

error_reporting(E_ALL);
ini_set('display_errors', 1);
set_time_limit(0);
header('Content-Type: text/html; charset=utf-8');
$array = file('links.txt', FILE_IGNORE_NEW_LINES);
for ($i = 0; $i < count($array); $i++) {
preg_match('/(?<=\d\/).*?(?=\/0\/)/', $array[$i], $name);
file_put_contents("$name[0].jpg", file_get_contents($array[$i]));
}
?>

на приведенных 5-ти ссылках, работает ok.

L
На сайте с 25.12.2013
Offline
315
#5
Alboy:
выскакивает ошибка
Parse error: syntax error, unexpected '*' in /var/www/admin/www/мой.сайт/333/1.php on line 8

адреса немного другие с перенаправлением
https://st-cdn.r.worldssl.net/items/562/562383/0/700.jpg
https://st-cdn.r.worldssl.net/items/111/1115596/0/700.jpg
https://st-cdn.r.worldssl.net/items/622/622812/0/700.jpg
https://st-cdn.r.worldssl.net/items/622/622813/0/700.jpg
https://st-cdn.r.worldssl.net/items/115/115005/0/700.jpg

В коде ошибки. Нужно убрать звездочки в переменных массива. Насколько я понял у тебя все урлы картинок все спарсены уже?

Недорогой, надежный и отзывчивый VPS хостинг ( https://bit.ly/3eXUnNN ) Проверенная пуш партнерка с ежедневными выплатами ( https://vk.cc/9wLSrL)
iccup
На сайте с 01.05.2016
Offline
195
#6

из программ с этим справится content downloader

kimsufi.com ( https://www.kimsufi.com ) очень дешевые и качественные дедики https://clck.ru/gvF9p - антибот, использую уже 3 года.
converse19880604
На сайте с 31.05.2009
Offline
164
#7

На линупсе через вгет можно, что-то типа wget -i urls.txt в консоли, ну или погуглить почитать про вгет, там все просто.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий