Составить XPath'ы для сайтов

andr0s
На сайте с 02.02.2010
Offline
76
988

Есть кастомный парсер текста, есть сайты (порядка 100-200 штук, точнее пока неизвестно). Нужно составить конфигурационные файлы для этого парсера следующего вида:

строка: //xpath1

Поле1: //xpath2

Поле2: //xpath3

Поле3: //xpath4

Все, каждый файл - максимум 5 строчек, максимум 5 xpath'ов. Обычно 3-4.

XPath'ы в большинстве случаев простые, типа //table[@class='table1']//tr или .//td[0]

Ничего сложного в задании нет, фактически нужно просто понимать что такое XPath, как их определять и тестировать на сайтах (те же Firebug и XPath Checker для FF - и все, больше ничего не надо). Уметь кодить не надо. Ну в общем кто знает, что такое XPath - поймет.

Практически все данные - из таблиц, поэтому и XPath'ы будут соответствующие (т.е. как в примере выше, с table, tr и td).

Полученные конфигурационные файлы надо сохранить в формате site1.ru.cfg, где site1.ru - домен сайта, для которого мы составили конфиг. Один сайт - один конфиг.

то есть по итогу получится 100-200 конфигов (возможно меньше, если для какого-то сайта тяжело или невозможно составить конфиг - ну бывают криво сверстанные сайты, что поделать)

Список сайтов предоставлю чуть позже.

Я сам в качестве теста создал уже конфиги для нескольких сайтов, получилось примерно минут 5 на один сайт - и чтобы открыть его, и чтобы составить конфиг, и чтобы протестировать xpath'ы). Бывает и дольше, бывает короче. Это так, для ориентировки.

Стоимость обсуждаема. Сроки не поджимают, но в день надо делать не меньше 10 xpath'ов, иначе процесс слишком растянется во времени.

Пишите лучше сразу в личку, вопросы туда же. На форуме я не особо часто бываю.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий