Как Google будет оценивать такие страницы ?

IL
На сайте с 04.10.2003
Offline
219
IDL
675

Например,есть файл index.html

И в нём есть строки:

aaaaaaaaaaaaaaaaaaaaaa

bbbbbbbbbbbbbbbbbbbbbb

cccccccccccccccccccccc

+всякая херь

есть файл index2.html

И в нём есть строки:

bbbbbbbbbbbbbbbbbbbbbb

cccccccccccccccccccccc

aaaaaaaaaaaaaaaaaaaaaa

+всякая другая херь

Как Гугл будет рассматривать файлы ? Как абсолютно разные ? Или всё-таки есть механизм для отслеживание повторяющихся моментов в файлах ?

S
На сайте с 17.10.2003
Offline
341
#1
Или всё-таки есть механизм для отслеживание повторяющихся моментов в файлах ?

Вроде как "шинглами" называют такой механизм, описание можно здесь поискать (не помню, пару месяцев назад тема поднималась)

Не все ссылки одинаково полезны ( https://www.svift.org/ ). Тут заказываю комментарии и отзывы ( https://qcomment.ru/ref/5651 ) для своих сайтов
S
На сайте с 27.06.2003
Offline
55
#2

Шинглы - контрольные суммы(КС) десяти-словий(как вариант скольки-то словий, например семи).

Т.е. рассчитывается КС для 10 слов начиная с первого слова документа, потом со 2-го и т.д. Если сколько-то КС в двух разных документах совпадает, то документы считаются копиями. Точный % совпадающих КС для того, что бы документы считались копиями науке неизвестен.

На практике не совсем работает. Может и работает, но только очень не сразу. Вставьте там-сям запятую или буковку для верности.

IL
На сайте с 04.10.2003
Offline
219
IDL
#3
Как писал Seliger
Шинглы - контрольные суммы(КС) десяти-словий(как вариант скольки-то словий, например семи).
Т.е. рассчитывается КС для 10 слов начиная с первого слова документа, потом со 2-го и т.д. Если сколько-то КС в двух разных документах совпадает, то документы считаются копиями. Точный % совпадающих КС для того, что бы документы считались копиями науке неизвестен.
На практике не совсем работает. Может и работает, но только очень не сразу. Вставьте там-сям запятую или буковку для верности.

Ну получается ситуация что при такой схеме и использовании шинглов - гугл скажет что страницы абсолютно разные

Например,есть файл index.html

И в нём есть строки:

aaaaaaaaaaaaaaaaaaaaaa

bbbbbbbbbbbbbbbbbbbbbb

cccccccccccccccccccccc

+всякая херь

есть файл index2.html

И в нём есть строки:

bbbbbbbbbbbbbbbbbbbbbb

cccccccccccccccccccccc

aaaaaaaaaaaaaaaaaaaaaa

+всякая другая херь

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий