насколько необходим подобный скрипт?

1 23
SeVlad
На сайте с 03.11.2008
Offline
1609
#21
burunduk:
если задачи у парсера достаточно однобокие - генерация контента

burunduk, мне казалось ты читать умеешь, поиск юзать тоже.. Не разочаровывай меня, плз ;)

burunduk:
это не проблема и для этого не надо распаршивать скаченные файлы

Из того "описания", что было показано - НИЧЕГО, кроме "скачать файлы" и "чего-то там запихать в одну таблицу БД" мега-скрипт не может (понты про расчёты нагрузок и умность заключённую в 200х строках.. их можно в пятом классе кидать, не тут плз.)

И да, что бы что-то получить - нужно а) скачать источник (полностью или нет) б) найти "это". Процесс, который делает (находит) эту выборку и называется парсинг. Так что - мимо.

Ростик =):
ценовой политики продукта

первый пункт опроса разве что :)

Ростик =):
Но, при правильном подходе - спрос будет

Хотя да.. дураков хватает :) Многие могут платить деньги за то что есть бесплатно (и порой даже лучше)

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
BM
На сайте с 16.02.2009
Offline
176
#22

Лучший способ потестить продукт - запустить его в продажу или хотя бы раздать бесплатную тестовую версию...

и да, подробное описание возможностей рулит! :)

sabotage
На сайте с 14.02.2007
Offline
192
#23
Burner-M:
и да, подробное описание возможностей рулит!

В предыдущих двухстах строках:

Многопоточный curl;

юни
На сайте с 01.11.2005
Offline
933
#24
burunduk:
Работает очень быстро, низкий расход памяти на поток.

Написан на PHP + MYSQL использует CURL и DOMDocument

Хм... у меня один из разработчиков написал вебсервер (причём под винду), который держит несколько тысяч запросов в секунду. И, по аналогии, такой же нагрузки краулер.

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
I3
На сайте с 13.04.2012
Offline
51
#25

Здравствуйте! Всем спасибо за проявленный интерес. С вами разработчик скрипта. На форуме долго не работала регистрация, поэтому не смог ответить сразу. Лёша тебе отдельное спасибо за пост.

SeVlad, Aria2c не имеет рекурсии, это значит что максимум, что вы сможете - это качать сайт по списку ссылок, я не говорю про минимальный интеллект, который необходим при загрузке нескольких сайтов одновременно. Пожалуйста изучите тему, а потом бросайте ссылки.

Данный скрипт представляет интерес для разработчиков PHP, а не для Linux администраторов. Поэтому, пожалуйста не задавайте вопросы, "зачем нужен этот скрипт, если например есть http://nutch.apache.org/"

[Удален]
#26

хм, интересная штука, я бы поюзаль....

1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий