Генератор карты сайта

123 4
TF-Studio
На сайте с 17.08.2010
Offline
334
#11

Ничего не надо делать

единственное лимит времени, чтобы снимался (почти везде есть) + curl (вообще везде должен быть)

Всё ещё лучший способ заработка для белых сайтов: GoGetLinks (https://www.gogetlinks.net/?inv=fahbn8).
Jaf4
На сайте с 03.08.2009
Offline
804
#12
ortegas:
В каких кругах?

у школьников.. заработать в интернет, сео.. найти, кто накликиванием зарабатывает уже сложно, все делают свои сайты.

New! NVMe VPS от SmartApe.ru (https://goo.gl/eoYYkS)
SeVlad
На сайте с 03.11.2008
Offline
1609
#13
ortegas:
Для некоторых скриптов еще базу нужно создать, куча модулей PHP установить, даунгрейднуть/обновить PHP, и прочая ерунда.

Это у тебя, как разработчика, могут возникать подобные проблемы. Большинство же юзеров даже не подозревают о существовании "каких-то там" модулей PHP, не то что об их установке-настройке. Максимальные трудности - создать БД (сложно, до не могу :)). А при каких-то проблемах (аля: не получает данные с другого сайта) - вопрос к хостеру и хостер всё решат :)

Как-то так в общем случае.

А в данном конкретном TF-Studio ответил (я так и подозревал, что ничего мало-мальски сложного быть не может).

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
TF-Studio
На сайте с 17.08.2010
Offline
334
#14

20 строчек кода ))

открыли, регуляркой прогнали, в массив засунули, в конце array_unique и в файл )

Это - простая версия, для более качественной, нужна БД.

Для хистори, более глубокого анализа, распределения нагрузки

SeVlad
На сайте с 03.11.2008
Offline
1609
#15
TF-Studio:
для более качественной, нужна БД.

Дело, конечно, хозяйское, но я так не думаю :) Максимум - файлы со временем сканирования в имени (sitemap15-09-2013-22-45.txt(\csv\html\etc)) или первой строкой.

TF-Studio:
более глубокого анализа, распределения нагрузки

Это ты сейчас о сайтмапе? ;)

TF-Studio
На сайте с 17.08.2010
Offline
334
#16

агамс, я люблю заранее закладывать масштабирование и перспективы.

БД нужна, для более быстрой и удобной проверки "проверяли эту страницу или нет".

Хотя можно и на файлах решить, в принципе, но БД привычнее.

SeVlad
На сайте с 03.11.2008
Offline
1609
#17
TF-Studio:
для более быстрой и удобной проверки "проверяли эту страницу или нет".

Я наверное чего-то не понимаю.. смысла обладания этими знаниями не вижу. Вот если бы ответ сервера проверять, или там историю-динамику создания\умирания страниц исследовать(хотя зачем?) - тогда да. Но при генерации карты сайты... По сути-то разовой "акции". Ну т.е. разового результата (в см "достижение цели").

...

Пока писал кацца начал понимать ;) Ты имеешь ввиду проверять на дубли во время составления сайтмапа? Ааа, ну тогда да. БД на больших сайтах будет побыстрее (наверное). А я-то в начале подумал про более долгосрочные перспективы :)

bay_ebook
На сайте с 28.05.2010
Offline
111
#18

Как "бредовая" идея

Сделать апи. Что бы я напрмиер смог с своему сервису прицепить ваш скрипт, при этом не скачивая аго, а просто тремя строчками кода + нагрузка на мой сервак не идет. Понятно, что не бесплатно :)

Нужен прогер на php+mysql+понимание чужего кода? (/ru/forum/540660) Вам сюда PHP-шаман (http://php-shaman.pw/)
TF-Studio
На сайте с 17.08.2010
Offline
334
#19

Если сайт очень большой, то чтобы не было утечек (расхода) памяти не нужных, стоит хранить где-то промежуточные результаты.

БД оптимальный вариант (memcache ещё и аналоги).

Просто лазать по 1 странице несколько раз не рационально.

bay_ebook, все обсуждаемо в этой жизни )

[Удален]
#20
TF-Studio:
Просто лазать по 1 странице несколько раз не рационально

с выдачи поисковиков берите

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий