- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Написал парсер сайта - сканирует сайт на внутренние ссылки, из которых затем генерируется карта сайта по протоколу Sitemap XML
http://humbert.ru/2008/07/09/sitemapxml-dlya-google-i-yandex/
humbert добавил 10.07.2008 в 08:55
кто-то пользуется? Есть минусы?
пытаюсь для себя написать чтото подобное для сужебных целей, так что ваш скрипт оказался очень в тему (нашел через яндекса), я пока не очень силен в пхп.
хотел задать вопрос, у вас там встречается рег. выражение "!<a\s(.*?)href=(\s*?)\"?'?([^\"'\s>]+)\"?'?(\s*?)[^>]*>!is" , не совсем понял для чего вторая подмаска (\s*?)
и второй вопрос, в данном случае будут ли какие то плюсы использавания CURL перед простым file_get_contents?
orphelin, я и сам не понимаю много. CURL дает больше возможности просто.
Вторая подмаска, на случай такой фразы <a href= humbert.ru >
Конечно. можно использовать потом trim(), но почему то так написал.
вот такую ссылку
<a href="javascript:JS('menu1','image1');" title="Развернуть/Свернуть"> <img name=image1 src="/pic/plus.gif"><b>О фирме</b></a>
неправильно обрабатывает, захвытывает как урл "javascript:JS(" , пока не хватило фантазии как побороть =)
orphelin, что-то такое: