softvariant.ru

softvariant.ru
Рейтинг
22
Регистрация
18.05.2008

Общие требования парсера, чтобы не дублировать всем интересующимся в личку, публикую на форуме:

  • нужно реализовать функцию, на вход которой передается урл некой категории новостей сайта
  • парсить нужно только новости категории урла (т.е. бывает, что по краям страницы есть тоже ссылки на новости других категорий сайта, их парсить нельзя)
  • если по урлу есть ссылки на др. страницы постраничной выдачи, то обрабатывать нужно только новости, опубликованные по урлу (т.е. по страницам ходить не нужно)
  • функция должна уметь выпарсивать любую категорию сайта (обычно они все однотипные)
  • чтение урла(ов) должно осуществляться через функцию file_get_contents
  • если при написании задачи Вам требуется реализовать несколько дополнительных функций, то тогда ВСЕ функции должны быть методами класса (т.е. либо Вы пишите одну функцию, либо все заворачиваете в один класс)
  • выпарсить нужно полный текст новости, обычно для этого требуется выпарсить урлы новостей переданых по входному урлу, а потом выпарсить сами новости по полученным урлам
  • в начале новости должен быть скрин, т.е. результирующий параметр text должен начинаться так:
  • <center><img src='url' title='' border='0'></center>
  • у новости должен быть файл загрузки (для ПО например), либо ссылка на онлайн видео (для видео новости)
  • если у новости нет скрина либо линков загрузки новость должна игнорироваться
  • резальтат нужно выдать в кодировке cp1251

15 дол за функцию, которая возвращает массив, каждый элемент масива содержит:

src_id - идентификатор новости

name - название

date - дата YYYY-MM-DD

text - html текст новости, в начале должна быть картинка

tags - таги (если есть)

Подробности в ЛС или ICQ. Самих источников много, т.е. это не разовая работа, можно писать много таких функций для выпарсивания и за каждую будет оплата.

miroku, приостановлен означает, что работы больше не ведутся, зп. не платяться, может лучше кинуть клич для поиска инвестора или на крайний случай, пока база и наработанные технологии живы, податься на аукцион?

poulter могу предложить создание автонаполняемого сайта онлайн фильмов: /ru/forum/249876

2 и больше Ваших сообщений в теме уже могут быть оплачиваемыми, т.е. по одному сообщение в 10 темах - не пойдет, как вариант подойдет 2 сообщения в 5 темах или, например, 5 сообщений в 2 темах и т.п.

Barcenal:
Можете кратко объяснить концепцию вознаграждений и оформление выплат?

Вкратце:

  • информативные сообщения, идущие в теме от Вас не подряд
  • от 2 сообщений в теме уже могут быть оплачиваемыми
  • минимум 10 сообщений в запросе для оплаты

др. нюансы, кот. просто регламентируют сам процесс, описаны в правилах. Достаточно сделать первый правильный запрос и получить выплаты, чтобы делать впреть все правильно. Народ уже активно пишет и набирает сообщений, в призовом фонде еще много денег, можно сорвать большой банк, если присоединиться сейчас к обсуждению уже начатых тем на кино форуме.

Новости по оплате: увеличена на 67% максимальная стоимость вознаграждения в день! п. 2.1 правил о вознаграждениях.

N_MONax:
Сейчас буду придираться к словам.

Ваше право ;)

N_MONax:
Вопрос: если сайт донор изменит алгоритм "шифрования" или формат выдаваемой информации или вообще закроется (по стуку, скажем) что в данном случае должен делать ваш потенциальный клиент?

На контента около 9000 роликов на тему для взрослых можно жить годами не меняя его! Чем по Вашему отличается видео "этого" процесса, снятого сейчас или год назад? А Вы уверены, что на сайте доноре ролики на первой странице новые, а не старые с обновленой датой? :) Др. вариант загружать видео на сервер клиента, чтобы быть огражденным от внешних источников. Хотя я и против этого, но по желанию клиента я могу это сделать за доп. оплату.

А теперь по существу: вот например тема /ru/forum/249876 об автонаполняемых сайтах на тему кино. Автообновление контента происходит по такой же схеме. Много моих клиентов пользуются данной системой, всех подерживаю, причем бесплатно! С начало этой программы, было выпущено уже много обновлений механизма автообновления по причинам, которые Вы описали. Хотя та тема не обновляется, до сих пор новые клиенты ее находят и обращаются.

Maganga, не беспокойтесь, Вы в не конкуренции :)

Всего: 192