Проблема с xml.

12
E
На сайте с 09.06.2003
Offline
96
3461

Проблема существует уже несколько месяцев.

Проблема в том, что xml приходит в кодировке windows1251. В xml встречается символ с кодом 0х98. А в этой кодировке такого символа нет. Поэтому скрипты глючат.

Вот как пример, страница с кривым описанием - http://www.ozon.ru/context/detail/id/16687460/ Там в тексте - a?peeling. Этот текст попадает в xml.

Вариант решения вопроса - перед созданием xml или во время создания xml удалять программно символ с кодом 0х98. Можно например его заменять другим символом, например пробелом. Или переделать xml в utf8.

Скрипты глючать на xml с книгами - художественная, не художественная литература. И возможно на других.

Поиск книг в интернет магазинах (http://bookza.ru)
OR
На сайте с 12.03.2008
Offline
123
#1

Здравствуйте!

Спасибо за тему и вопрос.

Как мы Вам отвечали в письме, "мы знаем об этой ошибке, она происходит из-за описания иностранных книг. Заявка на устранение причины проблемы в работе IT, но это все не очень быстро, т.к. они буквально завалены работой. Мы понимаем, что это слабое оправдание, но тем не менее надеемся, что вы нас поймете."

С уважением, Надежда

Служба поддержки партнерской программы OZON.ru (http://www.ozon.ru/context/partner/) Регистрация партнера (http://www.ozon.ru/?context=partner_join), Обратная связь (http://www.ozon.ru/context/partner_feedback/)
S
На сайте с 08.11.2008
Offline
34
#2

esergey, если интересно, могу предложить вам решение в виде php скриптов.

XML перегоняется в валидную путём удаления товаров, в которых присутствуют некорректные символы. В div_book.xml это около 100 товаров.

E
На сайте с 09.06.2003
Offline
96
#3

Да уже сам такую обработку сделал. Проблему, которую я решил за час, в озоне не могут полгода решить. Потому что it-специалисты заняты. :) Чего ж они там делают, что час времени за полгода не смогли выделить.

Я же думал, что хостинг не потянет обработку таких больших файлов. Оказалось норм работает.

M
На сайте с 27.02.2006
Offline
62
#4

Вообще XML файлы подобного объема уже нет смысла обрабатывать парсерами - лично я использую решения на регулярных выражениях - требования к памяти минимальные. И вообще, во многих парсерах есть настройкка для отключения валидации файла.

-> Продаю h4.ru (http://auction.nic.ru/search/list.cgi?s.keyword_in=&s.keyword=h4&s.domain_rubrics=&s.dom_length=2&x=35&y=4) Напишу парсер XML SQL CSV XLS любого объема и любого направления - от 0 до ... ГБ
С
На сайте с 10.03.2009
Offline
102
#5

Да xml не обновляют уже давно, можно вообще не париться.

Станичник (http://stanichnik.blogspot.com)
OR
На сайте с 12.03.2008
Offline
123
#6
Станичник:
Да xml не обновляют уже давно, можно вообще не париться.

Здравствуйте, уважаемый Страничник!

Будем Вам очень признательны, если Вы нам укажете какие именно каталоги не обновляются.

С уважением, Надежда.

С
На сайте с 10.03.2009
Offline
102
#7
OZON.ru:
Здравствуйте, уважаемый Страничник!

Будем Вам очень признательны, если Вы нам укажете какие именно каталоги не обновляются.

С уважением, Надежда.

Точно с 14 сентября не изменялся

http://static.ozone.ru/multimedia/yml/facet/div_tech.zip

Не изменились, или изменились очень мало (буквально на пару товаров, что при ваших объёмах крайне не существенно)

http://static.ozone.ru/multimedia/yml/facet/div_kid.zip

http://static.ozone.ru/multimedia/yml/facet/div_appliance.zip

http://static.ozone.ru/multimedia/yml/facet/div_home.zip

http://static.ozone.ru/multimedia/yml/facet/div_bs.zip

http://static.ozone.ru/multimedia/yml/facet/div_beauty.zip

http://static.ozone.ru/multimedia/yml/facet/div_fashion.zip

http://static.ozone.ru/multimedia/yml/facet/div_gifts.zip

http://static.ozone.ru/multimedia/yml/facet/div_rar.zip

Проверьте пожалуйста

PS: именно по архивам, т.е. zip файлам, т.к. качать неужатые не очень удобно.

С
На сайте с 10.03.2009
Offline
102
#8
Станичник:
Точно с 14 сентября не изменялся
http://static.ozone.ru/multimedia/yml/facet/div_tech.zip

Не изменились, или изменились очень мало (буквально на пару товаров, что при ваших объёмах крайне не существенно)
http://static.ozone.ru/multimedia/yml/facet/div_kid.zip
http://static.ozone.ru/multimedia/yml/facet/div_appliance.zip
http://static.ozone.ru/multimedia/yml/facet/div_home.zip
http://static.ozone.ru/multimedia/yml/facet/div_bs.zip
http://static.ozone.ru/multimedia/yml/facet/div_beauty.zip
http://static.ozone.ru/multimedia/yml/facet/div_fashion.zip
http://static.ozone.ru/multimedia/yml/facet/div_gifts.zip
http://static.ozone.ru/multimedia/yml/facet/div_rar.zip

Проверьте пожалуйста

PS: именно по архивам, т.е. zip файлам, т.к. качать неужатые не очень удобно.

Сейчас проверил xml в http://static.ozone.ru/multimedia/yml/facet/div_tech.zip

и в http://static.ozone.ru/multimedia/yml/facet/div_tech.xml одинаковые, т.е. тоже давно не изменянись.

OR
На сайте с 12.03.2008
Offline
123
#9

Спасибо!

Проверяем!

С уважением, Надежда.

M3
На сайте с 28.06.2013
Offline
2
#10

Да здраствуйте добрый ОЗОН!

Скажите вы ещё здесь?

Вопрос о том какие вообще есть архированные каталоги, и как получить их список?

данные партнера предоставлю если потребуется!

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий