- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Остался при мнении, что сделать реально, но явно не в 100 строк кода.
У меня тоже начиналось как для своих корыстынх целей.
Сделать - реально, но, к сожалению:
- не автоматически (машина на это, на должном уровне, пока не способна);
- не легко (от человека потребуется определённые знания, которые, впрочем вполне могут быть заложены в течении, максимум, недели).
Объём кода - на самом деле, чем больше, тем лучше - проще в использовании, потому что большинство вещей завязаны на обработку ошибок и нестандартных ситуаций. Кроме того, чем больше заложить в программу "страндартностей" сайтов - тем легче с этим работать (а, стало быть, быстрее создавать инструкции для извлечения информации).
Нет АБСТРАКТНОЙ задачи "забрать контент со страницы". Такие задачи - всегда КОНКРЕТНЫ.
Именно конкретикой задачи определяется: что брать, откуда брать, как обрабатывать, куда класть ...
Нет АБСТРАКТНОЙ задачи "забрать контент со страницы". Такие задачи - всегда КОНКРЕТНЫ.
Именно конкретикой задачи определяется: что брать, откуда брать, как обрабатывать, куда класть ...
Я и не говорил, что есть "абстрактная задача". Есть чёткая задача - забрать новости с сайта и положить их, например, в базу данных. Новость - это тема, тело сообщения и приложения к ней (картинки).
Если известен конкретный сайт (с его конкретной структурой), тогда это - вроде бы - простая задача ...
Помнится, пару лет назад мелькал сервис (российский) на котором вводилось понятие "шаблона". У них там были готовые шаблоны ко многим сайтам, и "через" эти шаблоны можно было заказывать (у них, совсем за дешево) получение "новостей" с этих сайтов.
Можно было также - за более существенные деньги - заказать изготовление "шаблона" к любому сайту - с последующим использованием его ни их же сервисе ...
Как это все у них там согласовывалось с авторскими правами - не помню, да и не разбирался ...
Кстати, если взять идею "алерта" и довести ее - в части привязки к конкретному (чужому!) сайту - до логического конца, то получится нечто весьма аналогичное упомянутой службе.
Только одна проблема: уникального шаблона нет и не будет (при существующем раскладе дел) - шаблон должен быть разным для каждого сайта (к сожалению).
С авторскими правами это тоже улаживается.
Да, конечно. Я же так и написал: готовые шаблоны ко многим сайтам.
Кроме того, эти шаблоны нужно еще и отслеживать (поддерживать в адекватном состоянии), поскольку структура сайтов время от времени меняется ...
А как - Вы предполагаете - это "улаживается с авторскими правами"?
Кроме того, эти шаблоны нужно еще и отслеживать (поддерживать в адекватном состоянии), поскольку структура сайтов время от времени меняется ...
И чтобы это было удобно и вообще возможно было сделать для значительного количества сайтов - нужен "правильный" софт - это и является задачей.
Подобный Российский сервис я не находил, буду благодарен за наводку.
Шаблоны исправлять должен все-таки наверное персонал сервиса ... вряд ли софт.
Наводку - увы: помню только, что было .. а где?
Шаблоны исправлять должен все-таки наверное персонал сервиса ... вряд ли софт.
Наводку - увы: помню только, что было .. а где?
Софт - это инструмент, а не то, что принимает решения, так что я про это ничего и не говорил...
Если я правильно помню, то задачи такого рода называются data mining ("извлечение информации" или "добыча данных")
Задача не такая уж и сложная, если только не учитывать поддержку актуальных шаблонов.
Вроде http://www.novoteka.ru/ является примером такого проекта.