Как Google будет оценивать такие страницы ?

IL

219

IDL

19 января 2004, 20:23

683

Например,есть файл index.html

И в нём есть строки:

aaaaaaaaaaaaaaaaaaaaaa

bbbbbbbbbbbbbbbbbbbbbb

cccccccccccccccccccccc

+всякая херь

есть файл index2.html

И в нём есть строки:

bbbbbbbbbbbbbbbbbbbbbb

cccccccccccccccccccccc

aaaaaaaaaaaaaaaaaaaaaa

+всякая другая херь

Как Гугл будет рассматривать файлы ? Как абсолютно разные ? Или всё-таки есть механизм для отслеживание повторяющихся моментов в файлах ?

S

341

svift

19 января 2004, 21:33

#1

Или всё-таки есть механизм для отслеживание повторяющихся моментов в файлах ?

Вроде как "шинглами" называют такой механизм, описание можно здесь поискать (не помню, пару месяцев назад тема поднималась)

Не все ссылки одинаково полезны ( https://www.svift.org/ ). Тут заказываю комментарии и отзывы ( https://qcomment.ru/ref/5651 ) для своих сайтов

S

55

Seliger

19 января 2004, 23:22

#2

Шинглы - контрольные суммы(КС) десяти-словий(как вариант скольки-то словий, например семи).

Т.е. рассчитывается КС для 10 слов начиная с первого слова документа, потом со 2-го и т.д. Если сколько-то КС в двух разных документах совпадает, то документы считаются копиями. Точный % совпадающих КС для того, что бы документы считались копиями науке неизвестен.

На практике не совсем работает. Может и работает, но только очень не сразу. Вставьте там-сям запятую или буковку для верности.

Google Updates - апдейты Яндекс выкосил 99.9% сайтов Технология компьютерного зрения заработала

IL

219

IDL

20 января 2004, 08:11

#3

Как писал Seliger
Шинглы - контрольные суммы(КС) десяти-словий(как вариант скольки-то словий, например семи).
Т.е. рассчитывается КС для 10 слов начиная с первого слова документа, потом со 2-го и т.д. Если сколько-то КС в двух разных документах совпадает, то документы считаются копиями. Точный % совпадающих КС для того, что бы документы считались копиями науке неизвестен.
На практике не совсем работает. Может и работает, но только очень не сразу. Вставьте там-сям запятую или буковку для верности.

Ну получается ситуация что при такой схеме и использовании шинглов - гугл скажет что страницы абсолютно разные

Например,есть файл index.html

И в нём есть строки:

aaaaaaaaaaaaaaaaaaaaaa

bbbbbbbbbbbbbbbbbbbbbb

cccccccccccccccccccccc

+всякая херь

есть файл index2.html

И в нём есть строки:

bbbbbbbbbbbbbbbbbbbbbb

cccccccccccccccccccccc

aaaaaaaaaaaaaaaaaaaaaa

+всякая другая херь

Что делать, чтобы попасть в ответы Google Bard

Google: E-E-A-T не является фактором ранжирования