тоже интересуюсь данным моментом. Если найдете хорошее решение, дайте знать плз.
Для выполнения этой задачи можно настроить Datacol. Вот кстати пример. Софт также очень гибок с точки зрения возможностей чистки полученного контента от всякого мусора.
чтобы он не терял смысла, здесь еще нужно подключать семантический словарь. Кстати сейчас думаю над созданием англоязычного авторерайтера для встраивания в наш парсер Datacol. Вопрос также интересует, поэтому если найдете хорошую базу, отпишитесь плз.
Для этой задачи можно настроить Datacol (по крайней мере для DMOZ я настраивал). Стучите в асю 435268826 - попробую помочь.
ошиблись разделом вроде как) но к слову вопрос - парсер десктопный? постит удаленно через xmlrpc?
спасибо помогли! Вот еще кстати есть у меня задачка - нужно со страницы - на которой ajax подгружает данные (по нажатию на ссылку) скачать эти данные (опять же средствами PHP). Это уже будет оплачиваемая задача. Если интересно стучите в личку
умеет ли парсер собирать информацию о товаре, выводимую через AJAX?
Могу сделать с помощью Datacol - только укажите точно источники парсинга и формат, который необходимо получить на выходе.
имхо называть это большим недостатком некорректно - такое случается ведь крайне редко - да и кто мешает поставить???
так если там есть встроенный браузер, то это же можно сделать вручную насколько я помню