- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Порядка 1ого гигабайта, надо его хотя бы в CSV перегнать. Может сфот какой или скрипт посоветуете, все что не пробую, либо виснет, либо не понимает его.
Perl?
Ищи парсеры, либо софт, работающие на EXPAT. Он гораздо более быстрый т.к. работает с потоком данных, без постройки дерева в памяти. То, что у тебя висло - скорее всего работает на SAX2 - он более "навороченный", но и в десятки раз более медленный.
п.с. 1 гиг - это не проблема. Проблемы с объемом данных начинаются после 2 гигабайт.
Да на чем угодно, perl, php, exe лишь бы работало, за совет спасибо буду искать.
Вот тут:
http://ua.php.net/manual/en/ref.xml.php
Как раз пример потокового парсинга.
Думаю, можно на его основе реализовать локальную консольную версию.
В самом начале скрипта установить тайм лимит, чтобы не вылетал через 30 секунд.
Результаты так и выводить через echo.
В винде привязать расширение .php чтобы по умолчанию открывалось с помощью php.exe
дале в консоли запускаем:
Порядка 1ого гигабайта, надо его хотя бы в CSV перегнать. Может сфот какой или скрипт посоветуете, все что не пробую, либо виснет, либо не понимает его.
а из-за чего виснет то выяснили? сдается мне что ограничения на сервере срабатывают (это как предположение) ...
Порядка 1ого гигабайта, надо его хотя бы в CSV перегнать. Может сфот какой или скрипт посоветуете, все что не пробую, либо виснет, либо не понимает его.
Готовых подходящих не видели, ибо все готовые подходящие которые видели, пытаются "сожрать" весь rss чохом и потом его уже разбирать. Но практически не смотрели подобное, поэтому наверняка не скажем.
RSS, если мы правильно помним, имеет достаточно линейный формат? Мы для парсения больших файлов с линейно занесенной инфой делаем так - считывается часть файла, обрабатывается, потом ручной контроль времени не прошло ли 10-20 секунд, если не прошло, то следующий кусок, если прошло, то редирект на себя же с параметром где указана текущая точка файла. fseek/ftell - для позиций по файлу, microtime для измерения времени. Собственно более чем банально, но тем не менее.
P.S.: Сорри что немного повторяемся.
А ссылкой не поделитесь (в личку)? Хочу протестить парсер новой версии скрипто. Буду очень Вам благодарен.