wdsg

wdsg
Рейтинг
31
Регистрация
09.02.2009

Единственный приходящий на ум алгоритм - парсим пауком все страницы, собирая внутренние ссылки... После устранения дублирующих ссылок, число оставшихся будет соответствовать числу страниц.

Приходилось решать задачи на PHP, требующие многопоточности. Вариант с запуском множества копий скрипта во фреймах отпал сразу. Вообще, дёргать веб-сервер, в данном случае, не стоит. Мне кажется, что самый оптимальный подход - запускать потоки вот так:


$Streams = 10; // Число потоков
for ($i=1; $i<=$Streams; $i++) {
system ('php script.php [параметры]');
}

Если у нас имеется некий список URL страниц для обработки, перед запуском делим его на число потоков, и, в параметрах, передаём каждому потоку, какую часть списка ему обрабатывать. Оптимальное число потоков определяем экспериментально.

vagazz, если интересует разработка с нуля системы-аналога зайцев (кроме радио), свяжитесь со мной, пожалуйста. Правда, дёшево обещать не могу.

pistol, да, про обильную "раскрутку" в курсе. Спамили партнёрские ссылки. Сейчас это дело там прикрыто.

php4all, Вам не кажется, что подобные вопросы необходимо обсуждать в приватной переписке? Но раз уж Вы решили вынести проблему на общее обозрение, отвечу в этой ветке. Вот только боюсь, что у большинства невольных наблюдателей случится приступ колик от смеха. Итак, Ваше предложение для проекта заключалось в том, что необходимо открыть форум. Всё. Поправьте меня, пожалуйста, если я упустил что-либо ещё. Многое можно понять, но требовать у кого-то деньги за эту идею или бояться, что я её у Вас похищу, прошу прощения...

pistol, на самом деле, мнения диаметрально противоположные. От "полный бред" до "нормальные вопросы". Как правило, первый вариант - от тех, кто не смог пройти тестирование, второй - от тех кто его прошел. Хотя, лично я не могу понять такого рьяного ажиотажа. Ведь вопросы там нужны только для того, чтобы отсеять на начальных этапах залётных "кидал", часто имеющих отдалённое представление о разработке, однако умудряющихся обработать заказчика на предоплату и т.п.

WebZoom, по идее, чем проще CMS, тем проще будет с ней работать. По стоимости сказать сложно. Всё зависит от структуры Вашего HTML. Сколько уровней вложенности и т.п. Напишите в личку или асю, если хотите. Окажу содействие чем смогу.

Можно парсить эти страницы и пихать в базу CMS-ки. В любом случае, я думаю, придётся написать небольшой "конвертер".

Если на сервере имеется поддержка PHP и допустим редирект, можно использовать вот такое грубое решение:

Создаём файл с расширением php. Например, link.php Пишем в него такой код:


error_reporting(0);

$Link = 'http://site.ru'; // Это URL, на который должен попасть юзер.
$File = 'counter.cnt'; // Это файл, в который будет писаться число переходов.

$Cnt = file_get_contents($File);
$F = fopen($File, 'w');
fwrite($F, ++$Cnt);
fclose($F);
header('Location: '.$Link);

В самой ссылке ссылаемся на наш файлик link.php

В результате, в файле counter.cnt имеем число переходов. Обратите внимание, что данный способ подходит только в том случае, если допустим редирект.

Вероятно, данное всплывающее окно было сгенерировано сервисом вроде этого http://popinbuilder.icoder.com/

FilmzIn, понимаете какая штука, любой разместивший ссылку может легко трансформироваться в закачавшего (хранение/распространение). Равно как и закачавший может, словно по волшебству, оказаться просто "знающим ссылку". Каждый конкретный случай зависит от серьёзности намерений волшебников и возможностей обвиняемого. :) На самом деле, я не пытаюсь напугать уважаемого GlazunOFF. Да и реальных прецедентов не много. Важно банальное понимание того, что любой безобидный повод, при необходимости, можно натянуть на вполне серьёзную статью.

Всего: 392