Технология небанящегося копипаста.

юни
На сайте с 01.11.2005
Offline
933
#71

Многие варианты коммерческого контента формально совпадают с отраслевым. Даты и анонсы выставок, фабричные индексы товаров, биржевые и валютные котировки, названия и виды деятельности компаний, телефоны с адресами и пр.

Что криминального в его дублировании?

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
basil34
На сайте с 27.04.2011
Offline
56
#72
Str256:

Отраслевые сборники нормативных документов, не подпадают под традиционное определение копипаста, по той причине, что не защищены авторским правом. Поэтому всякие госты, снипы, нормативы, законы могут присутствовать на десятках тысячах сайтов. И этот контент никак не влияет на их репутацию.

Но есть же и не отраслевой контент, и даже не тематический, а там уже расклад другой. В случае когда в выдаче много копий, то начинают просто работать вероятности - что забанят не твой сайт, а сайт соседа. И пусть даже не забанят, трафик ведь тоже будет делиться на всех, а продвинуться вверх на копипасте не получится, нужны будут ещё и ссылки. Исключения понятно есть, но чистый копипаст мало кто использует, его микшируют, разбавляют и т.п.

Ок, интересные мысли от вас исходят, теперь буду знать что яндекс проверяет тексты на защищенность авторским правом и по этому признаку определяет копипаст или нет, кстати не подскажите как яндекс на авторские права тексты проверяет? И то что яндекс определяет отраслевой контент от неатраслевого это тоже очень важно, наверно у них там база есть специальная отраслевого контента и они сразу по ней видят какой контент можно по 20.000 копий копипасты а какой сразу банить.

Так-же вот есть такие типы контента как статусы в контакте и анекдоты, до 2000 копий копипасты в выдаче встречается иногда. Наверно и статусы вконтакте и анекдоты тоже заносят в отраслевую базу, не знаю правда какой отрасли, но раз есть по 2000 копий значит отраслевая база, иначе никак.

Вот эта ваша фраза тоже понравилась очень- В случае когда в выдаче много копий, то начинают просто работать вероятности - что забанят не твой сайт, а сайт соседа. Она сразу показывает глубину мысли и широту познаний. Так и представляю висит робот яндекса в инете и у него 20.000 копий копипасты всяких анекдотов, пословиц,мудрых фраз и прочего шлака и он крутит русскую рулетку и определяет кому в индексе остаться а кому агс прислать.

Должен сказать что вы почему-то упорно отрицаете очевидные вещи и пытаетесь объяснить их какими то невероятными теориями про базы отраслевого контента, наличию фильтра на авторские права, на теорию вероятности которая начинает у яндекса работать когда копипаст через край хлещет. Не проще ли признать факты? факты они ведь упрямая вещь. 🤪

---------- Добавлено 10.05.2013 в 02:52 ----------

юни:
Многие варианты коммерческого контента формально совпадают с отраслевым. Даты и анонсы выставок, фабричные индексы товаров, биржевые и валютные котировки, названия и виды деятельности компаний, телефоны с адресами и пр.

Что криминального в его дублировании?

Чтобы яндекс мог понимать отличие комерческого контента от отраслевого он должен вообще понимать что он индексирует, судя по тому как яша со свистом кушает дорвеи, синонимайз, генерированые тексты и прочий шлак до понимания того что яндекс индексирует роботу яндекса пока еще расти и расти.Кстати говоря судя по всему на первоначальном этапе робот яндекса поглощает все, абсолютно все, затем что было проглочено попадает под фильтры и идет пользователю. На первый взгляд это кажется ерундой, но легко проверяется если ввести такие запросы которые людям не придет в голову вводить, а раз не придет то и фильтров делать на них не надо, вот тут то самая мякотка и должна брызнуть из всех щелей. 🤪

Итак встречаем запрос номер- 1

выдача поражает воображение напрочь.

особено вот такие тексты- 07-1250-80 3 Рабоч Матери Материа ая ал л среда корпус уплотнен а ия Присо Прив Диаме Дли Масс Изгоеод тр Dн, на L, а, кг товите динен мм мм ль ие нг ч бк ф р 300 500 238 9 нг ч бк ф ф ф ф ф ф ф ф ф р р р р р р р р р.

Просмотреть

еериъйвУ еериъйШУ еериъйиУ еериъйъУ еериъйХУ еерифйъУ еерифйфУ еерифейУ еериферУ еерифеШУ и и ъ ъ ъ ъ ъ ф ф ф ф ф вй ий ви Шй ий ъй Хй ъй фй ейй ерй еШй и ри и ей рй вй Шй рй Шй ъй фй ейй р р р р р р р в в в в в ейй пе ейй пе ейй.

Об Искусство костюма и текстиля И М И П Б Об Ф Ф Ф Ф Ф Ф Ф М М М М Об Об И ТЖ И Об М М Об Р Р Р Р Р Р Р Р Р Р Р Р Р Р Р Р Р Р Р Р Р Р Р Р Р Приемная комиссия ЮЗГУ

р/р р/р р/р р/р р/р р/р р/р р/р р/р р/р р/р р/р р/р р/р р/р р/р р/р р/р р/р по запросу по запросу по запросу по запросу по запросу по запросу по … ф ф ф ф ф ф по запросу по запросу по запросу по запросу по запросу по запросу по запросу по запросу по запросу по запросу по запросу по запросу...

Обратите внимание что все эти тексты в индексе, они ведь куда лучше чем рерайт или копирайт который выкидывается из индекса, отличный контент, можно сайты им набивать и все будет в индексе.Отличный первоклассный контент, кстати не попадает ни под какие фильтры так как фильтры пока не написаны на него еще, в индексе надежно сидит годами. Судя по таким текстам в индексе до базы отраслевых текстов весьма далеко еще.

A
На сайте с 03.04.2010
Offline
179
#73

При копипасте потенциально популярной статьи важно скопировать её одним из первых, так как яндекс вряд ли будет считать источником какой-то конкретный сайт, но все же последующие копии будут обьективно тыреные, и сайты отлично буду жить в индексе - пример сми сайты. Но вот если вы захотите напарсить старых новостей, копии которых разлетелись на тысячи сайтов то вряд ли такой сайт продержится в индексе.

А из выдачи выбрасывает яша копирайт, когда его долго никто не копипастит, ведь если статьи такие галимые, что никому не нужны, тогда нафик они яндексу? Моя имха

basil34
На сайте с 27.04.2011
Offline
56
#74
askary:
При копипасте потенциально популярной статьи важно скопировать её одним из первых, так как яндекс вряд ли будет считать источником какой-то конкретный сайт, но все же последующие копии будут обьективно тыреные, и сайты отлично буду жить в индексе - пример сми сайты. Но вот если вы захотите напарсить старых новостей, копии которых разлетелись на тысячи сайтов то вряд ли такой сайт продержится в индексе.

Дело обстоит с точностью наоборот. Кто первым полезет копировать тот и огребет агс, а вот старые статьи которые разлетелись на тысячи сайтов это самые лакомые куски, они то как раз и будут надежно сидеть в индексе и за них яша ничего не сделает.

Копиапст копипастом вышибать надобно и никак иначе.

A
На сайте с 03.04.2010
Offline
179
#75

basil34, вот сделайте смишник на новостях которым 1 час и 1 год, и посмотрим какие продержатся в выдаче

basil34
На сайте с 27.04.2011
Offline
56
#76
askary:
basil34, вот сделайте смишник на новостях которым 1 час и 1 год, и посмотрим какие продержатся в выдаче

Специально для вас процитирую

burunduk:
ну вот например 100% копипаст и в всегда в индексе без ссылок ;)

Пройдите по ссылке и поглядите, это смишник, только новости, только копипаст, и копипасту этому от 2008 года уже 5 лет. И все странички в индексе.

Устроит вас такой пример??

Согласно вашим соображениям такого не бывает, однако факты упрямая вещь.

A
На сайте с 03.04.2010
Offline
179
#77

basil34, вы притворяетесь что ли, что я не ясно написал? При чем тут пятилетний сайт? Те статьи копипастились еще 5 лет назад, и явно это были не фиг знает какие копии, да и алгоритмы были зеленые, и за время жизни сайт траст набрал. Скопируйте их сейчас и посмотрим как они выживут.

S2
На сайте с 07.01.2008
Offline
611
#78
кстати не подскажите как яндекс на авторские права тексты проверяет?

Никак не проверяет. Технически это невозможно проверить.

Наверно и статусы вконтакте и анекдоты тоже заносят в отраслевую базу, не знаю правда какой отрасли, но раз есть по 2000 копий значит отраслевая база, иначе никак

Вам виднее, раз вы это пишете. Я таких предположений не выдвигал:) Это просто развлекательный контент.

Так и представляю висит робот яндекса в инете и у него 20.000 копий копипасты всяких анекдотов, пословиц,мудрых фраз и прочего шлака и он крутит русскую рулетку и определяет кому в индексе остаться а кому агс прислать.

А я вот такого не представляю. Хороши же у вас представления о поисковой системе, если думаете, что она руской рулеткой пользуется:D

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
basil34
На сайте с 27.04.2011
Offline
56
#79
askary:
basil34, вы притворяетесь что ли, что я не ясно написал? При чем тут пятилетний сайт? Те статьи копипастились еще 5 лет назад, да и алгоритмы были зеленые, и за время жизни сайт траст набрал. Скопируйте их сейчас и посмотрим как они выживут.

И трава была зеленее и деревья выше.... 🤪

Может мне еще деньги за вас зарабатывать и вам в кошелек складывать?

Особенность серчианских прохвесионаллов- как только показываешь четкие и ясные факты с примерами сразу начинаются сказки про зеленые алгоритмы пятилетней давности, про траст чудодейственный, про то как яндекс фильтрует копипаст по авторскому праву и отраслевой базе, про чудодейственные фильтрв которые яндекс раздает по теории вероятности.

---------- Добавлено 10.05.2013 в 03:53 ----------

Str256 жаль что приходится вам напоминать ваши слова, но раз у вас такая короткая память то конечно напомню.

1-Отраслевые сборники нормативных документов, не подпадают под традиционное определение копипаста, по той причине, что не защищены авторским правом. Поэтому всякие госты, снипы, нормативы, законы могут присутствовать на десятках тысячах сайтов. И этот контент никак не влияет на их репутацию.

2-Но есть же и не отраслевой контент, и даже не тематический, а там уже расклад другой. В случае когда в выдаче много копий, то начинают просто работать вероятности - что забанят не твой сайт, а сайт соседа

Вот два ваших высказывания, хотелось чтобы вы внесли некоторую ясность по их поводу.

начнем с фразы номер 1- верно ли я понял что госты, снипы, нормативы, законы могут присутствовать на десятках тысячах сайтов, так как не защищены авторским правом и не подпадают под определение копипаста.??

Сразу возникает вопросы следущие.

Кто и как определяет что они защищены или не защищены авторским правом?

Кто и как определяет что они не попадают под определение копипаста.?

Затем я задал вам вот этот вопрос- кстати не подскажите как яндекс на авторские права тексты проверяет?

И вы на него радостно отвечаете-Никак не проверяет. Технически это невозможно проверить.

То есть лежит куча текста и яндекс ее Никак не проверяет в связи с тем что это технически невозможно проверить, но тем не менее яндекс хоть и не проверяет эту кучу текста, но твердо знает что это отраслевой контент и он авторским правом никак не защищен и копипастом не является и поэтому может отлично присутствовать на сайтах и не влиять на их репутацию.

Это я вас дословно цитирую чтобы не потерять ни одной мысли, скажите пожалуйста я все правильно понял? Или тут какой то иной смысл в ваших словах был заложен. Пока попрошу ответить на первый вопрос, а затем перейдем ко второму.

S2
На сайте с 07.01.2008
Offline
611
#80

Я пишу достаточно ясно, для тех у кого есть желание понимать, а не искать фразы к котором можно придраться. Спорить и что-то вам доказывать, ради спора не собираюсь. Каждое предложение которое я пишу закончено по смыслу, иначе говоря к примеру если в нём не упоминается яндекс, то всякие его привязки к нему - это уже ваши измышления, которые я не собираюсь комментировать.

В целом, да, если какой-то контент очень часто цитируется, он становится чем-то нарицательным, типа как как xerox, допускаю это. Но, одинаковые сайты Яндекс зеркалит, если бурундук купит 100 доменов, и на каждый зальёт копии своего сайта 1:1, то скоро они яндексом склеятся, в выдаче останется главное зеркало, а остальные выпадут из неё. А разбавлять сайт часто цитируемым уником, можно, но именно разбавлять чтобы риска склейки не было. И разбавлять нормальные долгосрочные сайты таким, на который нету авторских прав, чтобы проблем не было в дальнейшем, если контент какой-то книжки будет растиражирован по сотням сайтов, это не значит, что их все не смогут заблокировать по запросу суда.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий