парсер для озоновского xml

17

seolego

26 октября 2010, 08:38

1551

добрый день,

с озоном работал мало. поэтому тапками на закидываем.

несколько дней назад решил скачать их xml и на локальной машине (денвер) сгенерить сайт-магазин

алгоритм: написал на php файлик который разбирает xml и создает в отдельной папке много файлов, на каждую книгу отдельную страницу (ссылка на озон с партнерским кодом), на каждый раздел отдельную страницу (ссылки с раздела на страницу). на данный момент занимаюсь оформлением конечных страниц. еще день два работы.

собственно вопрос: оно вам надо?

готов поделиться наработками, может кому то будет полезно, или как готовый скрипт или как образец для своих опытов. не знаю можно ли по правилам форума выкладывать тут архив. или могу на почту выслать.

особенности: в сеть не выкладывал, как индексируется не знаю, как отнесутся поисковики не знаю. жрет много ресурсов и времени (работал с family.xml - 50 метров , обрабатывается около 3 минут, правил время работы скрипта в php.ini), на выходе около 4000-5000 html страницы со структурой, оформление (скорее всего) будет браться из отдельного файла, (чтобы не было копий дам просто образец - сами придумывайте как оформлять)

ну вот как то так, если есть интерес отпишитесь, там придумаем как передать вам файлы (бесплатно, код открыт, критика приветствуется)

с уважением Владимир.

ссылка на мой блог: Open MFA — реалити шоу (http://www.homelessinsamara.ru/archives/243) публичное создание и монетизация.

S

17

seolego

15 ноября 2010, 07:39

#1

добрый день. на данный момент всего двое заинтересовались моим творчеством. значит не настолько актуально для народа. но тем не менее.

переписал парсер. сделал его десктопным (exe файлик), писал на дельфе. работает в десятки раз быстрее. видимо я еще очень зеленый программист и рано мне соваться в серверный софт.

как оно работает сейчас. (инструкция для тех кто получил парсер по почте)

в папку с Ozon.exe закидываем *****.xml (раздел озоновского магазина)

туда-же три два файла с дизайном:

diz.html (дизайн конечных страниц с книгой)

diz_kat.html (дизайн категорий)

парсер разбирает на части xml. и в папке "www" создает много много страниц имя.html.

за основу беря файлы с дизайном и заменяя в них конструкции вида "=naz=" на название книги.

имя файла формируется из названия категории или книги.

=naz= - название книги

=avt= -автор книги

=str= - кол-во страниц

=sum= - стоимость

=izd= - издательство

=ops= - описание книги

=ogl= - оглавление книги

=menu= - вставляет список категорий

=url= - ссылка на озон (не забудьте сказать программе свой код)

желающие получить (бесплатно) пишите сразу куда отправлять. и по возможности отзывы и критику.

Скрипт партнерского магазина Озон Скрипт партнерского магазина ОЗОН Скрипт партнерского магазина Озон

Y

121

Yuji

29 ноября 2010, 08:39

#2

Интерес есть к парсеру картинок, которые лежат по адресу

multimedia/books_covers/

но как я понимаю такого функционала в вашем парсере нет, так?

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи

Маркетинг для шоколадной фабрики. На 34% выше средний чек