- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Маркетинг для шоколадной фабрики. На 34% выше средний чек
Через устранение узких мест
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Тест на производительность понятие субъективное
Не могу согласиться. Выбор технологии - вот это понятие субъективное, например, лично для меня легче поправить работающую регулярку, чем ваш код. Но я прекрасно понимаю, что это, возможно, от недостатка образованности - все-таки программирование у меня непрофильное занятие, а раз в год вникать во все детали непросто. Поэтому для оценки применяется единственный объективный критерий - скорость выполнения скрипта.
лично для меня легче поправить работающую регулярку, чем ваш код
Лично я, судя по первому посту, в этом сомневаюсь (хз, может вы специально убрали оттуда квантификаторы). Порой даже я в своих выражениях не могу разобраться через некоторое время, приходится вспоминать либо буквально ковырять ее по новому (иногда даже находишь более оптимальные выражения). Хотя да, чтобы поддерживать мой вариант нужно иметь представления о работе с DOM моделью, хотя бы из javascript. Скорость выполнения в парсинге далеко не самое главное, потому что обычно парсинг на "лету" встречается на часто, гораздо важнее удобочитаемость кода и легкая поддержка если вдруг на странице что-то поменяется - новый пробел, новый тег, класс. Поэтому "скорость выполнения" для меня понятие субъективное (скорость в разумных пределах конечно), особенно когда не нужно парсить на лету.
для парсинга html использую эту библиотеку:
http://simplehtmldom.sourceforge.net/
удобная вещь
(хз, может вы специально убрали оттуда квантификаторы)
Специально, пытался упростить выражение и поймать хоть что-то, но даже это мне не удалось :(
Не претендую на знание регулярок, но читать-править могу более-менее нормально, а вот самому написать что-то комплексное - как правило проблема.
Хотя да, чтобы поддерживать мой вариант нужно иметь представления о работе с DOM моделью, хотя бы из javascript.
Чего у меня, как вы догадались, нет. Я в основном программирую математические расчеты, когда в скрипте миллионы операций вычисления, на скорость приходится обращать внимание.
Скорость выполнения в парсинге далеко не самое главное, потому что обычно парсинг на "лету" встречается на часто
Эта штука как раз должна парсить на лету, а учитывая примерно 5000 страниц в прогоне и возможное распараллеливание, скорость явно не последнее место занимает в приоритетах.
В общем, здесь она важна :)
Ну если уж такой упор на скорость, то вот вариант вовсе без регулярок и библиотек для разбора DOM.
Тут используется анонимная функция и strstr с тремя параметрами, так что требуется как минимум php 5.3
Для тестирования будет использоваться код
Усредненный результат по трем прогонам, PHP 5.3.8
Возражения принимаются до полуночи.
$str будет переименовываться под то, что использовано в каждом решении.
Можно обойтись и вовсе без парсинга.Подобную информацию можно получить у гугла
и у etrade.com вроде есть api
Можно обойтись и вовсе без парсинга.Подобную информацию можно получить у гугла
За идею спасибо, но у гугла нет данных на GDX, например. Кроме того,
this API is deprecated since 2011/26/05
а без документации сообразить как получить не текущую экспирацию, а к примеру "April 17, 2015" - пока не могу. Будем искать у кого работает...
UPD: У яхи тоже пропали данные по GDX, оказывается...
Высокое жюри вынуждено принять неожиданное для себя решение.
Тесты не проводились, поскольку потеряли смысл. Хотя я был уверен в победе jkm с вариантом на strstr, предложенный webjey вариант с API на порядок снижает объем загружаемых данных, соответственно увеличивая быстродействие, так что вопрос о скорости парсинга просто отпадает.
Что лишний раз говорит о важности широкого взгляда на задачу.
🍻 webjey - WMR в личку.
Всем участникам - спасибо, я узнал много нового, даже не ожидал.
API всегда проще.
У финансов - навалом разных площадок.
Ищите каталоги api - найдете для себя море полезных данных нахаляву.