macrobo

macrobo
Рейтинг
99
Регистрация
07.04.2011
И возникло сомнение касательно того, что они отдают полный текст новости.

К сожалению, Вы ошибаетесь. В поверхностном описании их системы действительно указывается на то, что пользователь видит цитату и переходит по нужной ссылке. Вы можете сами в этом убедиться в общедоступной части их сайта. Однако всё самое интересное начинается в платной части сервиса.

Вот пример статьи (полностью воспроизведена с сайта-источника).

В разделе отчёты можно задать формат отображения: статья, аннотация, первая строка и первая строка с аннотацией.

Да и сами подумайте, для чего им отпускать пользователя, когда украденный контент можно сразу показывать у себя. Можете проверить количество переходов с их системы к вашим сайтам. Знакомые администраторы назвали мне такое число – 0.

Если не ошибаюсь, то подобный прецедент уже был. «Известия» и vk.com, когда последние ввели кнопку показа внешних материалов с полностью вырезанным контеном. Т.е. во всплывающем окне отображалась только статья и фото.

Кстати, они хотят получать Ваш контент на безвозмездной основе, при этом сами зарабатывают на Вашем труде.

Ксения, спасибо за ссылку. Хотя у нас ещё ни разу до суда дело не доходило. Каждый раз, при обнаружении незаконного использования объекта авторского права, всё ограничивалось высылкой предупреждений владельцу сайта или общением с регистратором/хостером.

В случае же скан-интерфакса, дело имеет немного другой вид. Никого не предупреждая и не читая пользовательские соглашения, они начинают высасывать контент. Отследить сложно, т.к., в отличие от обычных роботов, они себя никак не идентифицируют. Собранный контент хранится в их БД и предоставляется на платной основе подписчикам.

Посему мне и были интересны возможные варианты борьбы с таким «умельцами» (помимо простой блокировки).

и делаете ли Вы все по закону?

Странная постановка вопроса… Все должно быть в рамках закона; по крайней мере, стоит уважать труд автора и всегда указывать первоисточник.

Я делаю переводы как рус-англ, так и обратно, при этом обязательно ссылаюсь на оригинал. Однако, у меня не машинный перевод, а нормальный, литературный, посему каких-либо санкций от поисковиков не было, да и быть не должно :)

взять статьи с русскоязычного сайта

Если автор или правообладатель разрешает использовать данные материалы, то вы можете спокойно делать перевод (найдите или уточните условия использования статей). Более того, если вы делаете перевод, вы можете также указывать и себя в качестве автора перевода.

Что касается санкций поисковых систем, то, скорее всего, будет зависеть от качества сделанной работы.

Нашлись-таки ip адреса этих любителей жить за чужой счёт:

Interfax Moscow Hq Network: 46.28.17.0 - 46.28.17.255

interfax.ru 46.28.17.114
interfax-russia.ru 46.28.17.130
interfax.com 46.28.17.127

Interfax Moscow M1 Network : 46.28.16.0 - 46.28.16.255
spark-interfax.ru 46.28.16.113
scan-interfax.ru 46.28.16.248, 46.28.16.249


Plusinfo Isp Company
interfax-religion.com 82.179.197.137
interfax-religion.ru 82.179.198.35

На данный момент я отправил в бан 46.28.16.248, 46.28.16.249

Но для пущей убедительности, можно обе подсети дропнуть.

Для интересующихся. Я спросил двух администраторов, которые обслуживают сервера нескольких новостных порталов, и они тоже подтвердили, что без какого-либо договора или предупреждения, бот интерфакса полностью высасывает их контент. Вначале ломится на рсс ленту, потом идет по всем новым ссылкам. Бот не имеет user-agent’а.

P.S. Лучше использовать определение не «новость», а «статья» или «материал», так будет меньше путаницы.

Ксения, начнём с того, что речь идет об объекте авторского права, коим является продукт деятельности журналиста (называем это просто общим словом «новость»).

Кому интересно, приведу выдержки из ГК РФ.

Статья 1225. Результатами интеллектуальной деятельности и приравненными к ним средствами индивидуализации юридических лиц, товаров, работ, услуг и предприятий, которым предоставляется правовая охрана (интеллектуальной собственностью), являются:

6) сообщение в эфир или по кабелю радио- или телепередач (вещание организаций эфирного или кабельного вещания);

Статья 1228. Автор результата интеллектуальной деятельности

1. Автором результата интеллектуальной деятельности признается гражданин, творческим трудом которого создан такой результат.

Статья 1229. Исключительное право

Правообладатель может по своему усмотрению разрешать или запрещать другим лицам использование результата интеллектуальной деятельности или средства индивидуализации. Отсутствие запрета не считается согласием (разрешением).

Другие лица не могут использовать соответствующие результат интеллектуальной деятельности или средство индивидуализации без согласия правообладателя, за исключением случаев, предусмотренных настоящим Кодексом

Далее, стоит внимательно прочитать. Статья 1259. Объекты авторских прав

6. Не являются объектами авторских прав:
4) сообщения о событиях и фактах, имеющие исключительно информационный характер (сообщения о новостях дня, программы телепередач, расписания движения транспортных средств и тому подобное).

К этому пункту будут относиться высказывания, вроде: «Солнце взошло. Сегодня 20 апреля». Однако если журналист собирал информацию, описывал процесс восхода солнца и брал интервью у метеоролога, то пункт 4 ст.1259 уже не применим.

Если же вы настаиваете на том, что все «новости» не являются объектом авторского права, то прошу на стороннем ресурсе сделать пару копий статей того же ria.ru и подождать бумаги от юристов. Или просто расскажите это любому журналисту.

Следующий немаловажный пункт.

Статья 1274. Свободное использование произведения в информационных, научных, учебных или культурных целях

1. Допускается без согласия автора или иного правообладателя и без выплаты вознаграждения, но с обязательным указанием имени автора, произведение которого используется, и источника заимствования:

1) цитирование в оригинале и в переводе в научных, полемических, критических или информационных целях правомерно обнародованных произведений в объеме, оправданном целью цитирования, включая воспроизведение отрывков из газетных и журнальных статей в форме обзоров печати;

3) воспроизведение в прессе, сообщение в эфир или по кабелю правомерно опубликованных в газетах или журналах статей по текущим экономическим, политическим, социальным и религиозным вопросам или переданных в эфир произведений такого же характера в случаях, когда такое воспроизведение или сообщение не было специально запрещено автором или иным правообладателем;

У многих информ.агентств чётко указано, что без соответствующего согласия использования объектов авторского права запрещено. Более того, это даже можно и не указывать, т.к., опять же согласно ГК РФ (Статья 1229), отсутствие запрета не считается согласием (разрешением).

Следующий момент. Статья 1275. Свободное использование произведения путем репродуцирования 1. Допускается без согласия автора … в единственном экземпляре без извлечения прибыли: библиотеками и архивами для восстановления…

В случае же «скан-интерфакса», то они извлекают прибыль, живут за счёт оплачиваемой работы сторонних людей.

Виталий Макаркин:
Я хз что делать, денег лишних нет, буду переписываться с суппортом.

Скорее всего, вам лучше искать человека, который сможет правильно настроить VPS (оптимизировать nginx, apache etc), т.к. тех.поддержка не станет решать задачи клиента.

Виталий Макаркин:
А на WordPress стоке плагина нет?

WP-Tuner больше не поддерживается (судя по логам, не обновлялся более 2х лет). Единственная работающая реализация, которую удалось найти - WP-Tuner Revised. Как говорил, есть другие профайлеры, но данный меня привлекает функционалом и удобством выводимых сведений.

Виталий Макаркин:
от 378 - 405 количества запросов. Помойму это чрезвычайно много ?

Это нормально, когда у вас один посетитель… и вы не рассчитывайте на рост посещаемости.

Такое количество запросов в темах WP я вижу в первый раз, хотя, можно и не удивляться. Для сравнения: форум vbulletin, с установленными тяжелыми модами vbseo и некоторыми другими, в среднем делает по 19-25 запросов (без кэширования). Сайты на wp, которые мне приходилось оптимизировать (переписывание sql запросов в темах и плагинах, небольшие модификации ядра wp) – 20 запросов (это не для блога с одной категорией, а для новостных сайтов, где идет вывод большого количества разнородной информации).

Т.е., начните с оптимизации самих тем WP, это должно помочь.

Плюс, судя по тестам, у вас используется большое число плагинов, что тоже плохо. Много css/js

Ayavryk, поищите книги «Apache Security», «Nginx Web Server Implementation Cookbook» и другие. В них дается базовый уровень по защите и оптимизации.

offtopic:

Сентябрь:
Это как квантовая физика for dummy.

несведущему человеку можно даже объяснить соотношения неопределённостей Гейзенберга, при этом ни разу не написав постоянную Планка. Все зависит от уровня преподавателя и качества материала.

satellitmaker:
Пробовали замерить показатели сколько сейчас уходит ресурсов на обработу 1 страницы?
Сколько оперативной памяти, какое время генерации страницы, сколько запросов к БД ?

Действительно, можно воспользоваться любым профайлером, и посмотреть на узкие места. Я обычно пользовался WP-Tuner, потом перешел на WP-Tuner Revised (т.к. последний работает с новыми версиями WP). Данный плагин показывает количество запросов к БД, скорость генерации страниц и т.п. Есть еще и другие профайлеры. В любом случае, надо четко определить, что является узким звеном, и потом планомерно оптимизировать

1 234 5
Всего: 43