Привет Спецам! Вопрос о "плагиате"

1 234
T.R.O.N
На сайте с 18.05.2004
Offline
314
#31

Разработчик,

Верно. Кешируется то, что робот схавал. Вопрос только как давно.(?) У яши, да и у гуглера просто не хватит сил, чтобы в один момент времени перечитать все сайты. А если между такими реиндексами будет время, скажем 1-2 дня, то построенные на таком принцыпе "плагиаторы" - просто нелепы.

Поэтому сейчас выбран вариант, который реализовать "хватает сил". У кого больше ссылок на статью - то и автор(?).

Логика проста, много ссылок - значит больше заметили, - а значит там наиболее интересно.

Вопрос авторства и первоисточника - вопрос не для ПС, она (пс) должна просто найти то что просили, и при этом быстро и , повозможности, качественно.

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
T.R.O.N
На сайте с 18.05.2004
Offline
314
#32
tolik777:
Так что мое ИМХО: даже если вы написали статьу и Яндекс проиндексирует ее первым на вашем сайте, то еще нет 100% гарантии, что потом ваш сайт не выпадет из базы и уже ваш сайт станет проиндексированым позже, чем сайт с плагиатом.

а разве, это кто-то утверждает?

[Удален]
#33
Разработчик:
Так быстро - не стырят)

А рсс парсеры? ;) поставь для запуска рсс парсера крон на 5 сек.интервал и будешь самым авторитетным ньюсмейкером тогда?

T.R.O.N
На сайте с 18.05.2004
Offline
314
#34
Igor.O:
интервал и будешь самым авторитетным ньюсмейкером тогда?

будеш самым забаненым ....

[Удален]
#35
T.R.O.N:
будеш самым забаненым ....

а повнимательнее читать не получается? я говорю о технической стороне вопроса определения авторства по времени публикации. Интервал в 5-10 сек достаточен чтобы разможить одну и ту же новость по всему рунету. В таких условиях невозможно для ПС определить автора.

А про овощи недовольно промолчу 😡

T.R.O.N
На сайте с 18.05.2004
Offline
314
#36

Igor.O,

Подход к вопросу только с одно стороны, всегда ведет к неверным решениям.

Какраз Ваше решине возможно только с теоритической стороны.

Технически - не решимо.

Если бы это могло быть решено технически, то и ПС нашла-бы первоисточник.

PS те, кто хотят себя защищать, делают мелкие "пометки" в текстах.

- в рсс для разных служб выкладывают чуть измененный материал (чтобы всегда можно было найти "следы")

- в текст HTML подмешивают скрытый код, который "всплывет" на чужом сайте за счет стилей.

- частичная генерация в JS.

[Удален]
#37
T.R.O.N:
Igor.O,
Подход к вопросу только с одно стороны, всегда ведет к неверным решениям.
Какраз Ваше решине возможно только с теоритической стороны.
Технически - не решимо.
Если бы это могло быть решено технически, то и ПС нашла-бы первоисточник.

Технически не решимо что именно? Возможность драть чужое быстро и качественно? Опровергать по пунктам тогда уж :)

1. Я могу настроить свой рсс парсер таким образом что он будет драть новости скажем с 4-10-икс количества лент с интервалом в 5 сек.

2. Я могу настроить свой рсс парсер таким образом что он будет драть новости прямо с сайта ( за исключением джава скрипт, хотя можно драть через IE и в таком случае уже пофиг на жабе или нет есть контент - правда парсер будет более тормозным, но более универсальным)

3. я могу удалять все ссылки и игнорировать форматирование, для простоты вообще удалять все теги и ставить автоматом <br>

4. сделать простейший анализатор для замены английских букв "а", "о" и т.п. на соответствующие русские

T.R.O.N:
PS те, кто хотят себя защищать, делают мелкие "пометки" в текстах.
- в рсс для разных служб выкладывают чуть измененный материал (чтобы всегда можно было найти "следы")
- в текст HTML подмешивают скрытый код, который "всплывет" на чужом сайте за счет стилей.
- частичная генерация в JS.

На каждую хитрую *опу найдется свой винтик с еще более хитрой резьбой...

T.R.O.N
На сайте с 18.05.2004
Offline
314
#38

Igor.O,

Степень наивности растет!

Теоритически, и камень можно забросить на луну, но технические проблемы, возникающие по пути - непреоболимы. (С.Королев)

Вы сделайте, тогда поговорим. Информ. агенств, с достойным интересным материалом - мало. Бан получите на исходе первой недели(думаю быстрее). Попытки играться маскарадингом и т.д. на хорошей хост-платформе - вам никто не даст. А делать все на локалке, а потом заливать =)))

Igor.O:
1. Я могу настроить свой рсс парсер таким образом что он будет драть новости скажем с 4-10-икс количества лент с интервалом в 5 сек.
2. Я могу настроить свой рсс парсер таким образом что он будет драть новости прямо с сайта ( за исключением джава скрипт, хотя можно драть через IE и в таком случае уже пофиг на жабе или нет есть контент - правда парсер будет более тормозным, но более универсальным)

Вы снова слушаете только себя. Настроить то Вы сможете, кто Вам сказал, что эти ленты Вам будут отдаваться с такой скоростью. =)

Igor.O:
На каждую хитрую *опу найдется свой винтик с еще более хитрой резьбой...

Для этого нужно много думать и анализировать п*пы, а Вы, как я вижу, не сильно любите сие действие.

Я Ведь дал Вам просто направление.

[Удален]
#39

Прекращаю спор, т.к. он уходит далеко в сторону от реальности и топика :)

Все равно ПС не смогут индексить весь рунет и даже основные СМИ с интервалом в 5 сек. :)

T.R.O.N
На сайте с 18.05.2004
Offline
314
#40
Igor.O:
Прекращаю спор, т.к. он уходит далеко в сторону от реальности и топика

Это не спор а дискуссия. И плодотворная, для тех ксперементаторов, кто постоянно пытается тягать новости с моих серваков. Поэтому я Вам описывал живой опыт борьбы. =))

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий