Раньше был новые современные сайты, а этот старый динозавр в кодировке 1251---------- Добавлено 25.05.2019 в 12:28 ----------$links = 'http://hramy.ru/regions/city_abc.htm';
$pars = getPageByUrl ($links);
//$pars = iconv('CP1251','UTF-8',$pars);
require_once 'C:\OSPanel\domains\localhost\phpQuery.php';
$pq = phpQuery::newDocument($pars);
$elem = $pq->find('#table2');
$text = $elem->html();
Задачу я решил, это моя была инициатива вывести красиво :)) По кодировке не подскажите?
Вчерашнюю задачку решил - вытащив названия пицц из alt картинок.
Перешел к следующей задачи и опять застрял - кодировка сайта
Сначала пробовал менять тут
на
Перепробовал все виды сочетаний кодировок - победить не удалось.
Затем думаю подняться на уровень выше и менять кодировку в curl
Изменил
и в результате получаю пустоту при запросе. Почему?---------- Добавлено 25.05.2019 в 11:57 ----------Еще попробовал $result = utf8_decode(curl_exec($curl));
была строка
<th dir="LTR" class="style1" style="width: 118px">�����</th>
стала
<th dir="LTR" class="style1" style="width: 118px">?????</th>---------- Добавлено 25.05.2019 в 12:08 ----------curl_setopt($curl, CURLOPT_ENCODING ,"UTF-8");
или
curl_setopt($curl, CURLOPT_ENCODING ,"");
вообще не оказывают никакого влияния
Да, тоже наблюдаю периодически. Никаким стилями я это победить не смог.
Получил все названия и только 1 картинку (самая первая)
где ошибся?
Но тут вывод, насколько я понимаю опять такой же - сначала все названия, только потом картинки. Да от двух циклов ушли но как сделать вывод - название / картинка?
Дошел до парсинга реальных сайтов 😎
задача - получить названия и картинки пицц. Вот сваял я код, все получил.
И захотелось мне вывести красиво :
и вот тут я застрял на 2 часа :))) как можно совместить два цикла?
Дошел до круглого решил выложить свой список чуть более 1000 доменов отборного шлака.
Ничего лишнего, никаких конкурентов - только шлак.
Можете смело добавлять к своему, если будут дубли адсент их просто проигнорирует.
Че тут догадываться? домен .top - сразу в бан, без траты времени на анализ.
Нужно остаивть только домен 1 уровня и снова почистить от дублей. Завтра сделаю...
Продолжаю изучать phpQuery и запнулся вот о что... нужно найти все ссылки с нужным классом.
Как искать по отдельности или класс или ссылку, я знаю, а как все вместе?
пробую так, но явно где-то ошибка
---------- Добавлено 21.05.2019 в 17:15 ----------Ларчик просто открывался :))) $elem = $pq->find('a.www')->html();---------- Добавлено 21.05.2019 в 17:28 ----------Еще непонятка: так все нормально
Так ошибка цикла - почему? Warning: Invalid argument supplied for foreach()