Борьба с воровством контента

sergey24
На сайте с 12.08.2005
Offline
180
#51
angr:
а как по Вашему мнению договорятся ПС между собой, смогут ли, будут ли?

любое действие на ограничение вызывает противодествие...

как я говорил выше, сам являюсь собствеником уникального контента, и у меня его заимствуют, но я не волнуюсь и не обижаюсь, мой сайт по любому в выдаче практически всех ПС на первой позиции, недавно и яК приняли на халяву...

МОЕ ЛИЧНОЕ мнение - что бан за неуникальность контента это просто фантазии...

Вам просто повезло.

А с поисковиками нужно беседовать.

Им же легче будет работать.

меньше спама, меньше объема, меньше затратов ресурсов и т.д.

dimanaz
На сайте с 14.03.2006
Offline
84
#52

sergey24, ваше сообщение - изрядная глупость.

Текст либо зашифрован и его невозможно впринцыпе прочитать без знания ключа, либо он не зашифрован. То что вы предлагаете - замета текста на некий JS код, формирующий текст. Этот JS код может быть либо выполнен, либо распарсен.

ИНформацию от копирования защитить невозможно.

gorko.ru (http://msk.gorko.ru) mywed.ru (http://mywed.ru) svadba-msk.ru (http://svadba-msk.ru)
B
На сайте с 03.02.2005
Offline
165
#53
dimanaz:
ИНформацию от копирования защитить невозможно.

Выгравировать на титане и спрятать в лунном кратере =))))

Интеграция сайтов с 1С (товары, контрагенты, документы, заказы). Консультации и услуги. Есть готовые решения - быстро и недорого. Приглашаю к сотрудничеству агентства и веб-студии.
sergey24
На сайте с 12.08.2005
Offline
180
#54
dimanaz:
sergey24, ваше сообщение - изрядная глупость.

Текст либо зашифрован и его невозможно впринцыпе прочитать без знания ключа, либо он не зашифрован. То что вы предлагаете - замета текста на некий JS код, формирующий текст. Этот JS код может быть либо выполнен, либо распарсен.

ИНформацию от копирования защитить невозможно.

Я пытаюсь бротся с массовым копированием (парсингом), а не копированием отдельных страних.

Массово только парсят роботами.

Текст можно либо зашифровать JS

либо порезать на gif и выводить по частям - тут кому что лучше нравится.

Мне проще закодировать через JS

sergey24
На сайте с 12.08.2005
Offline
180
#55

Вот исходжник этой функции



class mosHTML {
/**
* simple Javascript Cloaking
* email cloacking
* by default replaces an email with a mailto link with email cloacked
*/
function emailCloaking( $mail, $mailto=1, $text='', $email=1 ) {
// convert text
$mail = mosHTML::encoding_converter( $mail );
// split email by @ symbol
$mail = explode( '@', $mail );
$mail_parts = explode( '.', $mail[1] );
// random number
$rand = rand( 1, 100000 );

$replacement = "\n<script language='JavaScript' type='text/javascript'> \n";
$replacement .= "<!-- \n";
$replacement .= "var prefix = 'ma' + 'il' + 'to'; \n";
$replacement .= "var path = 'hr' + 'ef' + '='; \n";
$replacement .= "var addy". $rand ." = '". @$mail[0] ."' + '@'; \n";
$replacement .= "addy". $rand ." = addy". $rand ." + '". implode( "' + '.' + '", $mail_parts ) ."'; \n";
if ( $mailto ) {
// special handling when mail text is different from mail addy
if ( $text ) {
if ( $email ) {
// convert text
$text = mosHTML::encoding_converter( $text );
// split email by @ symbol
$text = explode( '@', $text );
$text_parts = explode( '.', $text[1] );
$replacement .= "var addy_text". $rand ." = '". @$text[0] ."' + '@' + '". implode( "' + '.' + '", @$text_parts ) ."'; \n";
} else {
//$text = mosHTML::encoding_converter( $text );
$replacement .= "var addy_text". $rand ." = '". $text ."';\n";
}
$replacement .= "document.write( '<a ' + path + '\'' + prefix + ':' + addy". $rand ." + '\'>' ); \n";
$replacement .= "document.write( addy_text". $rand ." ); \n";
$replacement .= "document.write( '<\/a>' ); \n";
} else {
$replacement .= "document.write( '<a ' + path + '\'' + prefix + ':' + addy". $rand ." + '\'>' ); \n";
$replacement .= "document.write( addy". $rand ." ); \n";
$replacement .= "document.write( '<\/a>' ); \n";
}
} else {
$replacement .= "document.write( addy". $rand ." ); \n";
}
$replacement .= "//--> \n";
$replacement .= "</script>";
$replacement .= "<noscript> \n";
$replacement .= _CLOAKING;
$replacement .= "\n</noscript>";

return $replacement;
}

function encoding_converter( $text ) {
// replace vowels with character encoding
$text = str_replace( 'a', 'a', $text );
$text = str_replace( 'e', 'e', $text );
$text = str_replace( 'i', 'i', $text );
$text = str_replace( 'o', 'o', $text );
$text = str_replace( 'u', 'u', $text );

return $text;
}

B
На сайте с 03.02.2005
Offline
165
#56

=) И что, предлагаете яндексу поднапрячься и индексировать гифы? =0

А юзверам платить за траффик дестять тыщ мильёнов?

Бороться можно методом определения ботов по дибильному поведению. Но а) это сложно

б) бота можно научить быть похожим на человечика

Вон даже бедненький корбис не может бороться со скачивальщиками фотграфий, всевозможные жёлтые странчки не могут никак побороть парсеры...

=)

Кстати, имхо последние версии вгета и иже с ними настолько образованы, что не отличаются от человека по поведению... Скачать практически любой сайт на 100мбит канале - не вопрос. И тут уже и гифы распознать можно, и текст из эмулятора браузера вытащить...

sergey24
На сайте с 12.08.2005
Offline
180
#57
betam:
=) И что, предлагаете яндексу поднапрячься и индексировать гифы? =0
А юзверам платить за траффик дестять тыщ мильёнов?

Бороться можно методом определения ботов по дибильному поведению. Но а) это сложно
б) бота можно научить быть похожим на человечика

Вон даже бедненький корбис не может бороться со скачивальщиками фотграфий, всевозможные жёлтые странчки не могут никак побороть парсеры...
=)

Кстати, имхо последние версии вгета и иже с ними настолько образованы, что не отличаются от человека по поведению... Скачать практически любой сайт на 100мбит канале - не вопрос. И тут уже и гифы распознать можно, и текст из эмулятора браузера вытащить...

гифы я привел на краяняк

а вот функция кодирования и пароль для бота поискового

это дельная вещь

нужно только с поисковыми системами договорится, что бы ни банили сайты за кодированый контент, а ip бота можно и самому определить - их ни так уж и много.

просто собратся всем нужно и написать коллективное письмо всем поисковым системам.

bright
На сайте с 12.10.2006
Offline
20
#58
просто собратся всем нужно и написать коллективное письмо всем поисковым системам.

собратся и написать практически нереально, а если соберутся и напишут? читать его кто нибудь будет?

S0
На сайте с 23.11.2006
Offline
55
#59
XTR:
Мне кажется бороться с воровством контента в он-лайн можно достаточно просто, но для этого Яндексу и другим надо иметь бОльшие мощности, например:
1) Автор создает скрытую страницу с новой статьей/новостью... или список URLов с такими страницами.

было бы просто круто. :) через час уже проиндексируется. помоему нереал. ИМХО

Предлагаю хостинг icq 468655368. Отзывы (http://www.hostobzor.ru/opinion/op.php?pid=1518) еще Отзывы (/ru/forum/221296)
SK
На сайте с 14.11.2006
Offline
26
#60

А для кого опасно воровство контента? Для какого типа сайтов?

Серьёзно спрашиваю. Это ведь какой-то ограниченный набор сайтов, которых волнует, что у них украдут контент?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий