- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Переиграть и победить: как анализировать конкурентов для продвижения сайта
С помощью Ahrefs
Александр Шестаков
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
в свое время пришлось парсер писать самой. не то, чтоб супер получилось, но мне много не надо.
все парсеры, что мне попадались - очень заморачиваются на правильности тэгов. хотя, выслушаю все предложения насчет сишных библиотек.
(скажу сразу, libxml не понравилась :) )
Небольшое замечание - этот вопрос не для раздела о поисковых технологиях. Переношу.
А если перед парсингом пропустить через putty?
Ayavryk,
Помогает через раз...
Vyacheslav Tikhonov,
Лучше б в "Самое разное" кинул - там он, ИМХО, уместнее...
Ну да пусть здесь будет - не принципиально :)
Вопрос от новичка:
Что есть HTML-парсеры?
Прошу прощения за небольшой оффтоп :)
Похоже облом.
Придется Яву учить. ;)
Программы, которые "разбирают" HTML-код на "винтики" и его анализируют, индексируют, преобразуют... В общем, это основа почти всех программ, которые так или иначе обрабатывают HTML-страницы. Например, индексирующих роботов.
Interitus,
Ну, можно и не Яву... С++ для крутых поисковиков, или Perl, PHP, ASP - для web-сервисов или мелких поисковичков. Ява, ИМХО, только для web-сервисов годится... да и то, не очень удобна она в этом амплуа.
Ы-ым... ява - штука не та, наверняка... на сях быстрей. Ну, и скриптовые языки - тоже не то :) Хотя, кого-то и могут соблазнить обилием нужных функций.
lagif,
Каждый язык хорош для своего. И скриптовые парсеры порой очень полезны. Вот, например, я для одного своего сервиса его недавно попользовал... Ну зачем писать парсер на сях, когда весь сервис на PHP?..
lagif,
...Ну зачем писать парсер на сях, когда весь сервис на PHP?..
И правда :)