Помогите составить ТЗ для заказа парсера

K1
На сайте с 15.11.2014
Offline
153
1626

Хочу заказать парсер фотографий и дальнейшую их загрузку (автоматическую) в галерею Cyber. Заполнение полей вроде бы описал, а вот как описать автономную работу парсера не знаю(((

На сайте с какого будет он парсить в каждой из категорий много фотографий (более 1000 и они все), чтобы не было проблем с хостингом (сайт не лег) и поисковиками, какое количество фотографий (в сутки) он может парсить?

Вот пока получилось такое ТЗ, что я мог упустить и на что стоит уделить внимание? Часть про сам парсер, точнее его работу я не знаю как описать( Должен работать автономно без моего участия (1 раз запустил и он парсит), а вот сколько картинок стоит парсить и с какой периодичностью не знаю(((

1. Добавление фотографий через /photo-add с сайта /newgallery/.
2. В поле Название записываем title страницы (то что до запятой), (пример title страницы галереи: Тепловоз 2ТЭ116-012, ст. Бухара (50 лет железнодорожной магистрали Средней Азии, берем то что выделено).
3. В поле Описание записываем title страницы, (пример title страницы галереи: Тепловоз 2ТЭ116-012, ст. Бухара (50 лет железнодорожной магистрали Средней Азии).
4. В поле Автор записываем указанного автора на странице фотографии
5. В поле Файл заливаем изображение.
CS
На сайте с 01.05.2017
Offline
5
#1

6. Скрипт должен запускаться n-раз в сутки (Настроить CRON на сервере)

7. Отсеивать дубли уже имеющихся записей в базе данных

8. Парсить n-записей в n-времени

9. Логи работы парсера (success, fail)

Ну и самое главное, правильное распределение нагрузки на сервер. :)

K1
На сайте с 15.11.2014
Offline
153
#2

Коллеги, что еще нужно написать в ТЗ или этого вполне хватит?

CS
На сайте с 01.05.2017
Offline
5
#3
Коллеги, что еще нужно написать в ТЗ или этого вполне хватит?

Посмотрите в сторону готовых парсеров, и составляйте/дополняйте ТЗ исходя из них, ничего нового изобретать не нужно, велосипед давно изобретен.

B
На сайте с 01.06.2017
Offline
0
#4

Если что могу написать подобное. ТЗ понял ;)

S
На сайте с 23.05.2004
Offline
316
#5

Для парсера из ТЗ как правило требуется указать откуда брать контент и куда и в каком виде складывать. Плюс еще пожелание как запускать этот парсер. Остальное имхо лишнее.

Это просто подпись.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий