- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи
И выявили более 7 млн подозрительных пользователей
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
В своё время на форуме были популярны темы об агрегаторах контента, на основе Яндекс/Гугл ньюс, Yahoo Pipes, различных сборщиков rss и пр.
Сейчас как раз понадобился человек, который может поставить на поток поставку такого рода информации. Будут даны 10-30 ключевиков, по которым нужно будет предоставлять список новостей, на регулярной основе ("по крону") и в текстовом формате - именно текст, список новостей, а не ссылки на источники, краткие анонсы, неочищенную мешанину из тегов и букв и прочую непотребщину.
Кто не растерял навык - пишите в тему, об особенностях реализации и про желаемое вознаграждение.
P.S. Существует и правильный подход к контенту.
И тишина... где спецы-то? Перевелись?
Или деньги не нужны?
Можно настроить полный парсинг определенных ресурсов, но парсинг случайного ресурса (а вылезти в новостях может вообще любой сайт) на полном автомате (т.е. без каких-либо предварительных подстроек под него) это уже из области искусственного интеллекта.
Буду очень рад если кто аргументированно возразит - если есть алгоритм обработки случайного ресурса, с удовольствием его реализую.
Буду очень рад если кто аргументированно возразит - если есть алгоритм обработки случайного ресурса, с удовольствием его реализую.
95% есть. но в случае подробной новости
SergijKo, например, Брокен ещё два года назад решал массу задач через Pipes.
Там в рубрике ещё много всяких примеров
SergijKo, например, Брокен ещё два года назад решал массу задач через Pipes.
Там в рубрике ещё много всяких примеров
Pipes не волшебная палочка. Если грубо, это просто штука которая позволяет непрограммистам автоматизировать свои действия (причем предоставляет намного меньше средств, чем может использовать программист). Поэтому если даже программист не видит алгоритм, то с ней и подавно не решить такие задачи.
SergijKo добавил 25.11.2010 в 15:03
95% есть. но в случае подробной новости
Поиск наибольшего блока текста (одна достаточно известная реализация "парсинга" любой неизвестной страницы) не особо рабочее решение. Или вы не про то?
SergijKo добавил 25.11.2010 в 15:05
И кстати, о реализации.
Вспомнил - тут кто-то пару лет продвигал достаточно серьзный сервис как раз для того, чтобы мониторить все новые материалы по нужному запросу.
Идея была точно такая как вам надо - сервис все полные тексты как-то предоставлял.
Название сервиса пока не вспомнил...
мониторить все новые материалы по нужному запросу.
Актуально кстате, нужна такая штукенция в пользование.
нужна такая штукенция в пользование
+1. Нет, +100.
Дам денег реализовавшему.
http://webground.su/services.php?param=sendmail - это можете попробовать. По описанию что-то похожее на нужное.
SergijKo, хм... вроде бы ничего, но список источников:
Необновляемые источники (архив) 712
Неотрубрицированные источники 1006
Как-то не очень вдохновляет. Остальные, которые нужны, измеряются всего-то двузначными цифрами - с учётом того, что первоисточников по нормальным темам (производство/бизнес/наука, вместо всякой развлекухи) считанные единицы, получается, что работать придётся с дубликатами.
* Всего источников: 4009
Думаю, если им напишете они без проблем добавят пару десятков новых источников.
SergijKo добавил 25.11.2010 в 16:12
Пришла идея.
Как вариант можно использовать кастомный поисковик гугля (и в яндекса вроде тоже аналогичная штука есть).
Выбираете поиск по каким площадкам вам нужен (если их действительно пару десятков нужных), и получите поиск только по ним.
Так проверяя этот свой поисковик точно получите информацию о новых статьях в тему запроса.
Ну а потом уж ручками все-таки доставать (или же можете заказать автоматическую доставалку инфы из самых обновляемых ресурсов).