- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко

VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Добрый день. Может кто подскажет.
Есть сайт. В нем есть посты. В постах есть ссылки.
Есть скрипт, его задача проти по всем ссылкам на сайте и проверить живая ли ссылка или нет ( получить код ответа. )
Проблема в том, что при небольшом кол-ве ссылок все работает хорошо. Но если ссылок стает много, север выдает ошибку сервера. Я ставил set_time_limit в 0 но в результате 504 gateway time-out
Как можно проверить все ссылки за раз? Ибо кроме как делить их на части и и проверять группами варианта не вижу.
Спасибо за идеи
Добрый день. Может кто подскажет.
Есть сайт. В нем есть посты. В постах есть ссылки.
Есть скрипт, его задача проти по всем ссылкам на сайте и проверить живая ли ссылка или нет ( получить код ответа. )
Проблема в том, что при небольшом кол-ве ссылок все работает хорошо. Но если ссылок стает много, север выдает ошибку сервера. Я ставил set_time_limit в 0 но в результате 504 gateway time-out
Как можно проверить все ссылки за раз? Ибо кроме как делить их на части и и проверять группами варианта не вижу.
Спасибо за идеи
Естественно делить частями. Зачем сервер мучить?)
Вообще, советую повесить такой скрипт на планировщик, и проверять раз в n время в фоновом режиме.
Для все и сразу: попробуйте запустить свой скрипт не через веб, т.е. с командной строки или через cron.
А по уму:
один скрипт составляет список всех урлов,
второй скрипт, по крону, берет N урлов(если они есть) и проверяет.
Нужна проверка - забросили урлов, нет урлов - второй скрипт ничего не делает.
multiCurl если ссылок несколько сотен.
Если ссылок - тысячи: выгружать их в отдельную таблицу БД и чекать оттуда. Потом сверяться с данными этой таблицы.
Если сайт на впс -- временно увеличить лимиты до космических, либо слить сайт себе и локально сделать те же огромные лимиты (php.ini)
Для все и сразу: попробуйте запустить свой скрипт не через веб, т.е. с командной строки или через cron.
И какая разница, если эти ссылки (страница) генерится? ;) Все равно по http её нужно получить и распарсить и проверить. Сосбно затык не в http, а в распарсивании/проверке. Это да, лучше разбить на 2 или даже 3 отдельных задачи. Причем последнее - многопоточка.
Добрый день. Может кто подскажет.
Есть сайт. В нем есть посты. В постах есть ссылки.
Есть скрипт, его задача проти по всем ссылкам на сайте и проверить живая ли ссылка или нет ( получить код ответа. )
Проблема в том, что при небольшом кол-ве ссылок все работает хорошо. Но если ссылок стает много, север выдает ошибку сервера. Я ставил set_time_limit в 0 но в результате 504 gateway time-out
Как можно проверить все ссылки за раз? Ибо кроме как делить их на части и и проверять группами варианта не вижу.
Спасибо за идеи
Делайте проверку времени работы в самом скрипте. Как только превышает определенное значение, сохраняйте текущий id ссылки в сессию, и выводите кнопку Continue. А потом по нажатию все продолжится. Для однократного запуска это проще, чем с кроном мудрить:)
multiCurl если ссылок несколько сотен.
Если ссылок - тысячи: выгружать их в отдельную таблицу БД и чекать оттуда. Потом сверяться с данными этой таблицы.
Плюсую за multicurl. Я в своё время раз в десять-двадцать ускорял работу скрипта, который до этого в один поток загружал страницы.
Как вариант ещё уменьшить таймаут. Будет больше ложных срабатываний, но неработающие ссылки можно повторно чекнуть с большим таймаутом
Если ссылки в постах зачем страницы парсить? Берите посты из БД - на порядок ускорится проверка, хотя делить все равно придется, если тысячи.
Если ссылки в постах зачем страницы парсить? Берите посты из БД - на порядок ускорится проверка, хотя делить все равно придется, если тысячи.
да, и кстати временно в таблице можно создать поле checked. И каждый раз скрипт будет выбирать только где checked=0. Так решится проблема разделения на несколько запросов.
Что будет с ссылкой, если она окажется дохлой?