Старые - это которые по старому адресу лежат, или старые, которые не обновляются?
Все поддерживается, просто Озон обновленные версии к себе не заливает.
Вот тут можно скачать: http://ozon2.ru/parser/
А не работало, скорее всего, потому, что не было третьего уровня для XML-каталога - тоже столкнулся с этой проблемой.
Обновления я выкладываю по адресу: http://ozon2.ru/parser/
Озон не всегда оперативно реагирует на выход новой версии.
Никаких модулей не использует. Он самодостаточен.
Представляет собой запускаемый файл (можно скомпилировать под любую ОС).---------- Добавлено 22.05.2012 в 16:44 ----------
Скриншоты чего?
Вот есть лог работы парсера внутри окружения, которое скачивает XML, а потом грузит результат работы парсера в базу: http://ozon2.ru/local_uploader.log2012-05-22.log.
Ключевая информация по скорости в строчках вида
2012-05-22T07:14:43+04:00 Transform /var/www/tmp/toy.xml ==> /var/www/tmp/item.txt, /var/www/tmp/tag.txt, /var/www/tmp/item_tag.txt Transformed: 7427 items, 408 tags, 18128 item_tag links. 90 msec.
Ну и общее время тоже можно посмотреть.---------- Добавлено 22.05.2012 в 16:49 ----------
Как вы хотите скорость проверить?
Вот есть, например, лог его работы на моем сайте: http://ozon2.ru/local_uploader.log2012-05-22.log.
Одна из самых долгих операций парсинга:
2012-05-22T07:10:28+04:00 /var/www/tmp/print.xml extracted (2167220929 bytes) 2012-05-22T07:11:33+04:00 Transform /var/www/tmp/print.xml ==> /var/www/tmp/item.txt, /var/www/tmp/tag.txt, /var/www/tmp/item_tag.txt Transformed: 1513811 items, 51 tags, 1513825 item_tag links. 35370 msec.
Парсер платный. Я его не продаю пока, но изучаю спрос.
Есть парсер бесплатный: http://ozon2.ru/parser/.---------- Добавлено 22.05.2012 в 16:49 ----------
Никакие.
Парсер самодостаточен.
Исправил, спасибо! :)
Скорее всего, да, т.к. книг очень много стало - один print.xml 1.4 Гига в распакованном виде занимает.
До сих пор не работет :-\
Пришлось переключить поиск на собственную базу.
Можно использовать метод из парсера - там есть функция получения разделов первого, второго и третьего уровней.
Да, так и есть.
Кодировка там большого значения не имеет, потому что парсер вытаскивает только ссылки и ID каталогов.
XML-каталоги скачиваются отдельно. Для отображения web/index.php они не используются. Там вообще нет ничего, кроме ссылок.
Вот, посмотрите: http://stasdavydov.com/ozonru-parser/test/web/index.php.
Новой версии не было.
Привет!
Чтобы все заработало, нужно указать кодировку:
$transformer->transform($catalog,
array('PAGENUM'=>$page, 'PARTNER'=>$PARTNER_ID, 'URL_PARAMS'=>'path='.urlencode($path),
'PATH'=>urlencode($path), 'encoding' => 'windows-1251'));
Внес исправление в файлы дистрибутива. Спасибо за информацию.