- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Т.е. вы хотели получить список тайтлов, не скачивая страниц сайта? Нормально.
Есть несколько алгоритмов вытаскивания тайтлов. Хотел более оптимизированный. А Вам, я вижу, все равно, что качать...
Ну что? Обломался я с десяткой? 🚬
Ты не торопись. Пока я еще не нашел...🚬
Может и есть, но скрипт примитивный как Hello World, и вряд ли кто морочился выкладыванием в паблик.
Почти... Если DOM не использовать - могут всплыть некоторые подводные камни...
У меня есть готовый, отточенный тестами, php-скрипт, с заданием глубины парсинга страниц, с переходом по HTTP-редиректам, приведением русских тайтлов к единой кодировке и фильтром пропускаемых URL'ов по вхождению строки (например - расширению).
Могу скинуть линку на тему с отзывом заказчика (писался в качестве тестового задания, но доработки из моих идей) и сделать тестовый парсинг.
За полтиник зелёных отдам. :)
Есть несколько алгоритмов вытаскивания тайтлов. Хотел более оптимизированный. А Вам, я вижу, все равно, что качать...
Поскольку php-скрипт будет работать с удалённого сервера - не вижу особого резона в экономии трафика.
Но, если Вам нужно выкачивать гигабайты тайтлов в день :) - могу дописать модуль для обработки страниц в gzip.
Нужен парсер, способный выкачивать тайтлы и урлы от 10 000 страниц. 🚬