dough

Рейтинг
18
Регистрация
16.02.2008

2 KirillDes,

если парсит английский, готов приобрести

да, парсит. Могу выложить пример по тестовому кею.

2 response,

у тебя конечный список сайтов?

Список сайтов ограничен количеством найденных новостей по заданному ключевому слову.

Теоретически, можно обработать все сайты в выдаче. Практически, скрипт скорее всего остановится, когда время его работы достигнет ограничения на продолжительность выполнения исполняемого скрипта. Этот параметр можно выставить побольше и тогда, можно будет пытать счастья в очередной раз.

2 pini3n,

2 конструктивных отзыва!!!

К сожалению, у меня есть негативный опыт предоставления скрипта за отзыв. Поэтому, могу лишь сделать скидку в 20%.

Сделал скрипт для сбора новостей из выдачи Google News. Всех заинтересовавшихся прошу оставлять свои вопросы и пожелания в соседнем треде.

2 Rihard,

А инглишь текст парсит?

Да, парсит.

2 FlashBack,

Пример отпарсенного текста увидеть можно? например по кею "авто"

Созданный скриптом файл. Кодировка UTF-8.

Исправлен найденный баг. Теперь скрипт работает во всех бараузерах. От поддержки GET запросов пришлось отказаться в пользу POST.

Всем владельцам скрипта выслана обновленная версия.

2 Madness_Lvov

ТС, Скрипт кодированный?

Да.

Предлагаю в него добавить блеклист доменов куда НЕ ХОДИТЬ за новостями
Также можно из него сделать плагин для Wordpress

У данного скрипта сугубо утилитарное предназначение - собирать контент для генерации доров.

Алгоритм сбора контента можно доработать с целью сохранения новости целиком, вернее её большей части, т.к. структура каждого сайта уникальна и на каждый сайт задать свое правило сбора контента не представляется возможным.

После этого можно говорить о плагине для Wordpress.

2 All

Будет ли кому-нибудь интересен скрипт собирающий новости по заданному кею?

2 falkhan,

Знакомая фраза - в разработке кисточки не участвовали

Нет, не участвовал :)

Поддерживает шаблоны как надо складывать?

Нет. Из напарсенного контента составляется один блок текста без лишних тегов и прочей мешуры.

2 Sherh,

"собирает текст с сайтов" - собирает только со страницы, что была в google news или еще по сайту ходит?

Конечно же ходит по сайтам. Google news лишь предоставляет ссылки на ресурсы с контентом.

А почему именно google news?

Через Google news можно собирать русскоязычный и англоязычный контент.

12
Всего: 17