- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи
И выявили более 7 млн подозрительных пользователей
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Добрый день, уважаемые форумчане.
Нужна ваша помощь в тестировании одного небольшого WP плагина, который призван решить проблему воровства контента с ваших блогов.
Описание проблемы:
Воровство контента с блогов на WP. В большинстве случаев контент парсится через RSS-ленту и публикуется на сторонних сайтах до индексации на основном. Причина – отпарсить четко структурированную xml-ку RSS-ленты, зачастую проще, чем html-блога. Подтверждение предположения - http://gyazo.com/21debfc3d96de67308bd89fc89a82f56.png.
Решение проблемы:
Не отдавать посты в RSS-ленту до того момента, как их не заберут роботы ПС. Проверяем user-agent, а затем IP что бы исключить подмену. Как только роботы ПС посещают RSS-ленту, открываем ее для всех.
Другие возможности плагина:
- простановка копирайтов в теле контента и в RSS;
- запрет на копирование через правую кнопку мыши, на самом блоге(опционально);
- сбор статистики посещаемости RSS-ленты поисковыми роботами;
- блокировка ботов с user-agent, которые находятся в черном списке.
Пара принскринов:
http://gyazo.com/ebd8c9d39e18350046f2eb2cd2389087.png
http://gyazo.com/7f6e1dc007cb08c9a7e494fd059ad67b.png
С небольшой презентацией закончили, теперь к делу. Нужно 5 добровольцев, которые готовы не откладывая в долгий ящик установить плагин на работающий блог. Проверить его работоспособность, написать свои пожелания и замечания.
Заранее спасибо.
С уважением, Алексей.
готов попробовать...
для всех желающих помочь нам в тестировании плагина, сбрасывайте в ЛС:
- свою почту;
- icq или скайп для оперативной связи;
- ссылку на блог, на который будет размещен плагин.
Ну ок, буду парсить с самого сайта.
LEOnidUKG, конечно есть другие способы парсинга, кто бы спорил.
Речь идет о том, что бы на первом этапе перекрыть доступ к самому простому из них - парсинг структурированной RSS-ки. Пройдем этот этап, перейдем к защите самого сайта. Там свои нюансы, но это позже. Пока RSS
Нереально защититься от парсинга.
LEOnidUKG, конечно есть другие способы парсинга, кто бы спорил.
Речь идет о том, что бы на первом этапе перекрыть доступ к самому простому из них - парсинг структурированной RSS-ки. Пройдем этот этап, перейдем к защите самого сайта. Там свои нюансы, но это позже. Пока RSS
т.е. вы реально считаете, что если ПС скушает первая текст, а только потом парсер, то жертва не пострадает? 🍿
Полон мир наивных людей.
---------- Добавлено 06.11.2012 в 00:34 ----------
Нереально защититься от парсинга.
Реально, если не выкладывать в интернет, а хранить у себя в сейфе тексты. 🤪
LEOnidUKG, у вас есть примеры удачных сайтов, которые живут за счет спарсенного не уникального контента? Присылайте в личку, продолжим дискуссию там, так как ваши философские умозаключения уводят тему в глубокий офтоп.
TF-Studio, не стоит быть столь категоричными. В большинстве случаев достаточно "поднять планку входа", что бы решить возникшую проблему. Яркий пример - простенькая капча, распознать которую толковому программисту не составит труда - практически полностью решает вопрос спама.
Как бы то ни было, тема не подразумевает обсуждение продукта, который даже бету не прошел. Цель топика поиск бета-тестеров, есть желание помочь - отлично оставляйте контакты.
LEOnidUKG, у вас есть примеры удачных сайтов, которые живут за счет спарсенного не уникального контента? Присылайте в личку, продолжим дискуссию там, так как ваши философские умозаключения уводят тему в глубокий офтоп.
Изучайте:
http://www.google.ru/search?client=opera&rls=ru&q=%D0%A1%D0%BA%D0%BE%D0%BF%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BB%D0%B8+%D1%81%D0%B0%D0%B9%D1%82&sourceid=opera&ie=utf-8&oe=utf-8#hl=ru&newwindow=1&client=opera&hs=S5S&rls=ru&sclient=psy-ab&q=%D0%A1%D0%BA%D0%BE%D0%BF%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BB%D0%B8+%D1%81%D0%B0%D0%B9%D1%82+site:forum.searchengines.ru&oq=%D0%A1%D0%BA%D0%BE%D0%BF%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BB%D0%B8+%D1%81%D0%B0%D0%B9%D1%82+site:forum.searchengines.ru&gs_l=serp.3...3462.5082.0.5265.7.7.0.0.0.0.1187.1187.7-1.1.0...0.0...1c.1.lWFmNXaQCJk&pbx=1&bav=on.2,or.r_gc.r_pw.r_qf.&fp=5c2863004a69f27b&bpcl=37189454&biw=1920&bih=933
Леонид, перед тем как давать ссылку посмотрите каким числом датируются результаты выдачи.
И еще раз прошу, хотите продолжить дискуссию - пишите в ЛС. Прекратите офтопить.
Не отдавать посты в RSS-ленту до того момента, как их не заберут роботы ПС.
Функционалом движка предумотренна отдача только анонса с определенным количеством знаков.
- простановка копирайтов в теле контента и в RSS;
После парсинга боты чистят контент от внешних ссылок.
- запрет на копирование через правую кнопку мыши, на самом блоге(опционально);
Это этого побегут не столько копипастеры, сколько живые юзеры.
У меня есть мысль, как оставить право первого индексирования за своим сайтом. Дарю идею:
После того, как статья сабмитится на сайт, ей присваивается url, по которому пост становится доступным. Но сам адрес не появляется нигде - ни на главной сайта, ни в rss-ленте, ни в сайтмапе. Вообще нигде. Адрес отправляется в аддурилку. И только после появления в индексе пост появляется на сайте в ленте, rss и т.д.
Вариант добавления в индекс не через аддурилку (ибо там капча): сайтмапу присвоить произвольное имя и не занося его положение в роботс, добавить прямо в ЯВМ и ИВМ. Как результат - о сайтмапе будут знать только поисковики.
Удачи. Хорошее начинание.