Подскажите движок, с которого всех труднее тянуть (парсить) контент

12
B0
На сайте с 09.05.2012
Offline
17
1620

Решил для своего нового проекта (сайт со статьями) использовать DLE. Однако, в сети наткнулся на множество мнений, что статьи (новости) с ДЛЕшных сайтов легко сливаются на другие сайты с помощью всякого рода парсеров и прочих скриптов автонаполнения сайта. Скажите так ли это? Действительно ли на ДЛЕ трудно противостоять парсерам?

Также слышал другое мнение, что труднее всего перетаскивать статьи с wiki движков. Объясняется это специфической разметкой данного движка (так называемая wiki разметка). И что из-за нее копировать статьи с wiki сайтов в автоматическом режиме очень трудно. Вы с этим согласны? Действительно ли mediawiki обделен вниманием автонаполнителей?

SeVlad
На сайте с 03.11.2008
Offline
1609
#1
balabas0v:
Подскажите движок, с которого всех труднее тянуть (парсить) контент

Со всех легко (причем тут движок..). Была бы голова.

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
Ervin
На сайте с 15.08.2008
Offline
112
#2

Сделайте сайт на флеше. С него стянуть контент ооочень сложно. Даже поисковые роботы трудности испытывают, что уж про какие-то там парсеры говорить! :)

Credendo vidas!
DV
На сайте с 01.05.2010
Offline
644
#3

Больше всего трудностей доставило мне отсутствие движка. Когда вёрстка различается от страницы к странице, порой требуется очень долго дописывать парсер.

VDS хостинг ( http://clck.ru/0u97l ) Нет нерешаемых задач ( https://searchengines.guru/ru/forum/806725 ) | Перенос сайтов на Drupal 7 с любых CMS. ( https://searchengines.guru/ru/forum/531842/page6#comment_10504844 )
WebJunior
На сайте с 11.06.2010
Offline
155
#4
DenisVS:
порой требуется очень долго дописывать парсер.

и потом, если что, долго перепиливать сайт самому, зачем?

TC, лучше делай так что бы контент который у вас тянут не приносил никому большой пользы, кроме вас.

Мой сайт на этом хостинге - https://tuthost.ua/?from=2558 / Верстаю шаблоны (темы с отзывами: https://searchengines.guru/ru/forum/763758, https://searchengines.guru/ru/forum/600404 ).
veteranbk
На сайте с 24.11.2011
Offline
106
#5

Вон на wp на все случаи жизни плагины, и защиту видел(непмню как реализовывается).

Сам я в rss выводил только заголовки и первые пару строк(непомню как делал).

ну и в статьях надо писать "здравствуйте дорогие пользователи blablabla.ru".

Патамушта если скрипты ставить, то неудобно и себе и пользователи бесяца.

7 млн дропов (/ru/forum/957502)
K
На сайте с 06.12.2011
Offline
62
kto
#6

Если контент нужен - его спарсят откуда угодно.

Urbanoid
На сайте с 20.03.2010
Offline
152
#7
WebJunior:
и потом, если что, долго перепиливать сайт самому, зачем?
TC, лучше делай так что бы контент который у вас тянут не приносил никому большой пользы, кроме вас.

А это как, можете привести пример?

p.s. А еще лучше, чтобы у вора, укравшего контент, начиналась полоса неудач. Только как написать такой контент?

V
На сайте с 20.04.2010
Offline
93
#8

Трудно будет парсить, только если к классам в коде будет добавляться какая-либо переменная, сбивающая парсер с толку.. :)

Но если Ваш сайт будет не прицеле и это бесполезно.

pelvis
На сайте с 01.09.2005
Offline
345
#9

Чем больше верстку запутаете, тем меньше возможностей спарсить контент. Хотя практика показывает, что парсится абсолютно все! Был бы прогер хороший.

Продаю вывески. Задарма и задорого (https://www.ledsvetzavod.ru/)
WebAlt
На сайте с 02.12.2007
Offline
266
#10

ТС, спарсят всё и с любого двига, была бы голова и интерес к вашему ресурсу самого чела-парсера, пока интереса нет, соответственно и ни кому это не нужно.

С DLE обычно парсят через RSS, отключите поток и доставите неудовольствие многим школо-парсерам. ;)

Когда сайт чётко встанет в ПС, включите, если нужда будет.

Также в DLE есть такая возможность: Использование RSS потоков разного типа одновременно

В принципе "волков бояться, в лес не ходить".

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий