парсер википедии

referees
На сайте с 13.12.2009
Offline
115
1151

мне нужно спарсить куски контента из 52 139 статей в википедии

то есть у меня есть список статей:

http://ru.wikipedia.org/w/index.php?title=%D0%A1%D0%BB%D1%83%D0%B6%D0%B5%D0%B1%D0%BD%D0%B0%D1%8F:Search&limit=250&offset=0&redirs=1&profile=default&search=*%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F

мне нужно, чтобы парсер собрал БД с четырьмя полями:

номер | название | описание | ссылка на статью

номер - по порядку

название - заголовок

описание - первый абзац статьи (где расшифровывается название)

пример:

http://ru.wikipedia.org/wiki/%D0%92%D0%B5%D0%BA%D1%81%D0%B8%D0%BB%D0%BB%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F

№п/п | Вексиллология | Вексиллоло́гия — вспомогательная историческая дисциплина, занимающаяся изучением флагов, знамён, штандартов, вымпелов и прочих предметов подобного рода. | http://ru.wikipedia.org/wiki/%D0%92%D0%B5%D0%BA%D1%81%D0%B8%D0%BB%D0%BB%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F

на выходе с вас - дамп в мускуле, с меня - деньги

с предложениями и оценками временных затрат пишите в личку.

---------- Добавлено 13.05.2012 в 14:02 ----------

Спасибо, умелец найден.

вДропе.ру (http://vdrope.ru) — поиск слов в освобождающихся .ru и .рф доменах
S5
На сайте с 04.01.2010
Offline
77
#1

Цену вопроса в личку можно?

DeL Esprit
На сайте с 27.01.2010
Offline
223
#2

денег сколько?

Тестирую облачный майнинг - узнаем развод или нет. - окупаемость 3 месяца? мелкие суммы (https://goo.gl/aPWmoj) | майнинг Monero, минимум $830 (https://goo.gl/3XivbP) Биржи (ввод/вывод) - на Приват (https://goo.gl/CGZTnD), на Payeer, Capitalist, Advcash, Qiwi... (https://goo.gl/eejAgs)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий