По каким признакам "клеют" сайты?

[Удален]

22 сентября 2006, 21:18

2802

Если полностью одинаковый контент на страницах сайтах, то склеет однозначно!

А если допустим взять два сайта с полностью одинаковым контентом, но на одном сайте поменять абзацы текста местами, как тогда отреагирует яндекс, поклеет сайты или нет? Ведь получается что типа тексты разные... у первого сайта первый абзац один, а у второго сайта первый абзац другой.

Кто-нибудь проводил подобные эксперементы? Поделитесь наблюдениями ПЛИЗ!

[Удален]

22 сентября 2006, 21:19

#1

Может и не склеют, но забанят точно :)

344

Klopopryg

22 сентября 2006, 21:25

#2

Gezer:
Может и не склеют, но забанят точно :)

Да!? можно посмотреть где написано, что яндекс банит одинаковые по контенту сайты или примеры!?

Введите какой-нибудь низкочастотник и посмотрите выдачу - несколько десятков сайтов будет чуть ли не подряд, которые будут содержать ОДИНАКОВЫЙ текст! Кстати, это даже бесит... еще 5 лет назад так было, так ничего и непридумали, чтобы в выдачу не выдавать подряд страницы с одинаковым текстом!

Лучше выстрелить, перезарядить и еще раз выстрелить, чем светить фонариком и спрашивать - "кто тут?"

Унижения яндекса продолжается, накрутка Сайт с ответами от Яндекс кобласит

[Удален]

22 сентября 2006, 21:28

#3

Ну сорри сорри, выдал желаемое за действительное или наоборот :)

Р

258

Разработчик

22 сентября 2006, 21:32

#4

Klopopryg, может быть напрасно Вы так категоричны? Ну склеивает же Яндекс ссылки с одинаковыми текстами и регистрации с одним и тем же описанием, почему не склеит сайты с одинаковым конентом? Не обязательно склеит, но если увидит то наверняка, нет?

344

Klopopryg

22 сентября 2006, 21:33

#5

Разработчик:
Klopopryg, может быть напрасно Вы так категоричны? Ну склеивает же Яндекс ссылки с одинаковыми текстами и регистрации с одним и тем же описанием, почему не склеит сайты с одинаковым конентом? Не обязательно склеит, но если увидит то наверняка, нет?

Пример в выдаче показать!?

Р

258

Разработчик

22 сентября 2006, 21:41

#6

Klopopryg, Вы меня не так поняли, я не говорю, что так не делают, простоу Яндекса руки (боты) недоходят до этого. Но справился же он с дорвеями, хоть в какой-то степени, Вы можете утверждать что он не возьмётся за склейку одинаковых контентов? А выдачу, конечно, привидите пример плиз..

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

155

Exotic Fruit

22 сентября 2006, 21:45

#7

Klopopryg:
Пример в выдаче показать!?

На самом деле если диз разный, то шансов что забанят мало, но есть шансы - что на один из братьев близнецов наложат фильтр какой-нибудь. Если дизайн одинковый, то пару раз сталкивался со склейкой сайтов

PREBORIS (http://www.preboris.ru)

344

Klopopryg

22 сентября 2006, 21:48

#8

Exotic Fruit:
На самом деле если диз разный, то шансов что забанят мало, но есть шансы - что на один из братьев близнецов наложат фильтр какой-нибудь. Если дизайн одинковый, то пару раз сталкивался со склейкой сайтов

вы про сайты с одинаковым конетнтом говорите или про те, которые описал топикпастер!?

D

165

diafan

22 сентября 2006, 21:48

#9

SNIPER:
Если полностью одинаковый контент на страницах сайтах, то склеет однозначно!

А если допустим взять два сайта с полностью одинаковым контентом, но на одном сайте поменять абзацы текста местами, как тогда отреагирует яндекс, поклеет сайты или нет? Ведь получается что типа тексты разные... у первого сайта первый абзац один, а у второго сайта первый абзац другой.

Кто-нибудь проводил подобные эксперементы? Поделитесь наблюдениями ПЛИЗ!

Алгоритм вычисления уникальности контента таков:

весь текст делится на десятисловия - как бы "наборы" из десяти слов. Для каждого такого десятисловия считается контрольная сумма. Думаю, вы знаете как это делается, для каждой буквы, имеющей свой ASCII-код. Таким образом получается компактная последовательность контрольных сумм, "описывающих" любой текст.

Если робот где-то встречает менее 20% совпадений последовательности контрольных сумм - о плагиате речь не идет. Если в каком-либо новом тексте около 30-40% процентов совпадений - понятно, по материалам какого(-ких) сайта(-ов) он писался.

Если же более 60-70% совпадений контрольных сумм - скорее всего плагиат, просто в нескольких предложениях переставлены слова. Ну а 90-98% совпадений - все ясно!

В случае перестановки абзацев - останется точное количество контрольных сумм и их последовательность. То, что "переставлены абзацы" - робот вычисляет на раз!

Правда, Роман правильно сказал, эта технология еще не до конца введена в алгоритм и одинаковый текст в серпе есть на разных стоящих подряд сайтах.

Однако, это, по большей части, из-за того, что HTML все-таки разный... :)

DIAFAN.CMS (http://www.diafan.ru/), система управления сайтами.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

186

Dervish

22 сентября 2006, 21:49

#10

SNIPER, ответ на вопрос находится на сайте Яндекса: там есть две статьи об алгоритме склейки

diafan, это алгоритм "шинглов", насколько я помню. У Яндекс другой алгоритм.

Пингвин под микроскопом. (http://ac-u.ru/arts/pingvin-pod-mikroskopom/) Особенности продвижения Интернет-магазинов. (http://ac-u.ru/arts/osobennosti-prodvizhenija-internet-magazinov-bytovojj-ili-kompjuternojj-tekhniki-s-interesnymi-primerami-i-zabavnymi-kartinkami/) Копирайтинг. Качественно. (/ru/forum/725909)

VK приобрела 70% в структуре компании-разработчика red_mad_robot

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ