Что такое шингли?

123
J
На сайте с 08.06.2006
Offline
844
#11

Если я правильно понял, то шинглы для того, чтобы вычеслять умников которые делают рерайт статей перестановкой слов и предложений?

MASe
На сайте с 17.09.2002
Offline
219
#12
joost:
Если я правильно понял, то шинглы для того, чтобы вычеслять умников которые делают рерайт статей перестановкой слов и предложений?

ну если переводить в технологию саттелитов - то да...

а в теории - для того, чтобы очистить и оптимизировать СЕРП

Only God Can Judge Me... Nobody Else... Дрезна (http://www.drezna.ru/) Помощники: Sape (http://www.sape.ru/r.167724536c.php)
Hkey
На сайте с 30.09.2006
Offline
222
#13
joost:
Если я правильно понял, то шинглы для того, чтобы вычеслять умников которые делают рерайт статей перестановкой слов и предложений?

Не совсем алгоритм шингов не шибко стойкий, хотя он может определить незначительную ручную работу над текстом. Частую перестановку слов он не сможет определить. А вот перестановку больших предложений или абзацев он сможет определить.

HTraffic.ru (http://HTraffic.ru/) - удобная система для управления контекстной рекламой. тема на форуме (/ru/forum/810827) HTracer (http://htracer.ru/) - скрипт для автопродвижения сайтов по НЧ и СЧ запросам. Для больших сайтов от 100 страниц. (тема на форуме (/ru/forum/676867))
J
На сайте с 08.06.2006
Offline
844
#14

Гугл тоже использует шинглы?

J
На сайте с 08.06.2006
Offline
844
#15
joost:
Гугл тоже использует шинглы?

или что-то другое?

я правильно понял - шинглы могут быть разные?

Hkey
На сайте с 30.09.2006
Offline
222
#16
joost:
или что-то другое?

я правильно понял - шинглы могут быть разные?

Гугл использует другой алгоритм.

Не понял вопрос про разные шинглы.

Реализация может быть разная алгоритма

1. По длине основания. ... 7,8,9,10,11 ... слов

2. По предваительной фильтрации. Удаление стоп слов, преобразование синонимов и т.д

3. По сверке например: 85 максимумов случайных функций

4. Устойчивости шингла от порядка слов.

5. И самое главное критерии необходимости проверки (супер шинглы, связь сайтов ссылками) и другое.

J
На сайте с 08.06.2006
Offline
844
#17

Hkey,

Hkey:
Не понял вопрос про разные шинглы.

Реализация может быть разная алгоритма
1. По длине основания. ... 7,8,9,10,11 ... слов
2. По предваительной фильтрации. Удаление стоп слов, преобразование синонимов и т.д
3. По сверке например: 85 максимумов случайных функций
4. Устойчивости шингла от порядка слов.
5. И самое главное критерии необходимости проверки (супер шинглы, связь сайтов ссылками) и другое.

это и был ответ на мой вопрос! Спасибо!

Hkey:
Гугл использует другой алгоритм.

Какой? Где о нем почитать?

MASe
На сайте с 17.09.2002
Offline
219
#18
joost:
Какой? Где о нем почитать?

может быть повторюсь - но никто не афиширует алгоритм этой работы...

иначе... иначе было бы очень интересно ;-)

J
На сайте с 08.06.2006
Offline
844
#19

MASe, но о алгоритме Яндекса хоть что-то извесно! неверю, что о Гугле, а точнее о том как он определяет дубли ничего не извесно! Интересуют даже догадки!

NickPro
На сайте с 27.07.2007
Offline
20
#20

Разве Яндекс до сих пор использует метод шинглов?

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий