По каким признакам "клеют" сайты?

1 234
Р
На сайте с 23.05.2006
Offline
258
#21

diafan, Новичек, коли б всё было так логично и красиво =)

Н
На сайте с 20.01.2006
Offline
48
#22
Разработчик:
diafan, Новичек, коли б всё было так логично и красиво =)

Согласен. Сам не пробовал метод "изложение". Мне кажется, что трудозатраты на него аналогичны трудозатратам на написание новой статьи на заданную тему.

Го (http://GoStart.ru) - самая пленительная игра (http://forum.kido.com.ru) в мире.
seasick
На сайте с 22.04.2005
Offline
113
#23
Dervish:
diafan, это алгоритм "шинглов", насколько я помню. У Яндекс другой алгоритм.

Вот как раз именно Яндекс и использует алгоритм шинглов.

D
На сайте с 09.06.2006
Offline
165
#24
Dervish:
diafan, это алгоритм "шинглов", насколько я помню. У Яндекс другой алгоритм.
seasick:
Вот как раз именно Яндекс и использует алгоритм шинглов.

А вот чтобы не спорить, вот вам ссылка: http://company.yandex.ru/articles/article10.html 🚬

И.Сегалович: "... Для решения ... задачи Udi Manber ... предложил идею ... , а Andrei Broder ... придумал название и довел до ума алгоритм «шинглов» ... " (с)

DIAFAN.CMS (http://www.diafan.ru/), система управления сайтами.
moich
На сайте с 19.11.2005
Offline
34
#25

А если менять ссылки

например на сайте А ссылка /sylka.hml

на сайте В /sylky.hml

возможно ли в этом случая склейка!?

MK
На сайте с 18.08.2005
Offline
126
#26
А вот чтобы не спорить, вот вам ссылка: http://company.yandex.ru/articles/article10.html
И.Сегалович: "... Для решения ... задачи Udi Manber ... предложил идею ... , а Andrei Broder ... придумал название и довел до ума алгоритм «шинглов» ... " (с)
Ответить с цитированием

Чуть ниже там же

Чтобы у читателя не создалось впечатление, что информационный поиск исключительно западная наука, упомяну про альтернативный алгоритм определения почти-дубликатов, придуманый и воплощенный у нас в Яндексе [ilyinsky]. В нем используется тот факт, что большинство поисковых систем уже обладают индексом в виде инвертировнного файла (или инвертировнным индексом) и этот факт удобно использовать в процедуре нахождения почти-дубликатов.
нет
D
На сайте с 09.06.2006
Offline
165
#27
moich:
А если менять ссылки
например на сайте А ссылка /sylka.hml
на сайте В /sylky.hml
возможно ли в этом случая склейка!?

Т.е. если просто менять имя файла? Конечно склеит!

Да какая разница? Имя файла, имя домена, слэш, вопросик... Вы читали чуть выше? 🙄

Яндекс клеит не имена файлов: в сети туева хуча страниц, например, news.html - все клеить? 😆

lINIA
На сайте с 26.07.2006
Offline
31
#28
Gezer:
Может и не склеют, но забанят точно :)

Недавно возник подобный вопрос, общался с суппортом, на что получил следующий ответ

"максимум что грозит, это склейка"

CK
На сайте с 31.08.2006
Offline
71
#29

Я менял абзацы местами, и заменял в каждом абзаце 2-5 слов. Пока ничего не склеилось! (в абзацах 40-70 слов)

T.R.O.N
На сайте с 18.05.2004
Offline
314
#30

SNIPER,

Чаще всего при перестановке мест абзацев, смысл текста всерано теряется. Так может просто начальный текст взять как исходник для цепей Маркова. Можно получить много почти уникальных текстов, которые можно даже назвать читаемыми.

Склеивать такое боту на настоящем этапе невозможно.

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий