Парсер постов форумов

12
AP
На сайте с 20.05.2008
Offline
4
1957

Хочу создать индекс постов с форумов и в последствии предоставлять поиск по этому индексу.

Может кто уже делал это, помогите с реализацией.

Нужен парсер постов форумов.

zhidronsss
На сайте с 12.10.2007
Offline
36
#1

из всей затеи самый простой момент это напарсить посты

каким образом на чем и где реализовать индекс и поиск по нему -вот это задача?

Brand from Amber
На сайте с 18.08.2007
Offline
293
#2

ArPg, а чем ваш индекс будет лучше (скажем) вот этого? ...неужели областью действия? А, если не секрет, зачем сиЁ нужно?

Лучший способ понять что-то самому - объяснить это другому.
AP
На сайте с 20.05.2008
Offline
4
#3

Есть некоторое количество закрытых для индексации яндексом, гуглом и прочими поисковыми системами сайтов. Закрыты они по ip. На этих сайтах выкладываются файлы находящиеся в кольце по обмену трафика между провайдерами. А когда нужно чтото найти это сводится к ручному просмотру всех сайтов. Хотелось бы зделать все по удобнее

Brand from Amber
На сайте с 18.08.2007
Offline
293
#4

ArPg, так если это Ваша "система обмена", то сделайте поиск по LIKE. Ну а если не Ваша, то парсите и.... "сделайте поиск по LIKE" (опять же) ;)

AP
На сайте с 20.05.2008
Offline
4
#5

В принципе и вопрос в том как отпарсить сайты на дижках (в основном) vBulletin, phpBB и ucoz

S2
На сайте с 07.01.2008
Offline
611
#6
ArPg:
В принципе и вопрос в том как отпарсить сайты на дижках (в основном) vBulletin, phpBB и ucoz

А это не пробовали использовать?

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
Brand from Amber
На сайте с 18.08.2007
Offline
293
#7
ArPg:
В принципе и вопрос в том как отпарсить сайты на дижках (в основном) vBulletin, phpBB и ucoz

ДЫК всё же просто! Для этого достаточно написать парсер. ☝ (в этом деле подробнее объяснить тяжело). Если не можете сами - вот Вам хороший специалист в этом деле.

P.S. Не стОит благодарностей ;)

AP
На сайте с 20.05.2008
Offline
4
#8

Все сайты закрыты и доступ только с определенных ip поэтому Str256 твой вариант не пойдет.

ArPg добавил 29.11.2008 в 01:14

Brand from Amber, бюджет проекта не позволяет заказывать на стороне. Хочу сам разобраться и научиться.

Brand from Amber
На сайте с 18.08.2007
Offline
293
#9
ArPg:
Хочу сам разобраться и научиться

А что конкретно ТУТ (на форуме) узнать хотите? Что значит - "помогите с реализацией" - за Вас всё написать? Если нет, то задавайте конкретные вопросы.

P.S. На чём "кодить" планируете? ...ИМХО для парсинга лучше PERL-а ни чего не придумали ))

P
На сайте с 08.03.2007
Offline
250
#10

зачем вообще парсить, если цель - найти что-то? Поставьте поисковый двиг свой, и просто индексируйте сайты как просто сайты.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий