Проверка на уникальность Яндекса. Рабочий алгоритм.

12
ZOOOL
На сайте с 01.02.2010
Offline
10
#11
yascherka:
Ну и что? Поиск со звездочками. Шинглы-то тут при чем? При сравнении текстов методом шинглов вычисляются контрольные суммы кусков текста длиной N. Звездочки вы тоже в контрольную сумму засунете?

А если просто попытаться мыслить абстрактно???

******* какой то текст из семи слов *******

этот текст может повторятся на других хостах

Если под маской есть повторения с текстами других хостов значит текст не уникален

Я не думаю что Яндекс выложит алгоритмы.

вопрос в том какие входные данные на алгоритм проверки.

Здесь пытаются выложить свои наблюдения

А с технической стороны..реализовать можно многое лиш бы хватало мощностей.

[Удален]
#12

Ясно только одно - никто ничего не знает) Есть только кучка догадок...

Выходит что сервис neotext.ru/check очередная догадка...

ZOOOL
На сайте с 01.02.2010
Offline
10
#13

Сделать нужно опыт и проверить вогнать текстов в Индекс с разными параметрами, и проверить на факт схожести. Займусь на досуге...

TheGRAM
На сайте с 23.07.2008
Offline
133
#14
Пассаж не уникален.

А теперь объясните им еще и про пассажи и все остальное :)

1. Тиц 10 за 12$ - работает! (/ru/forum/250674) ICQ:364-244-059 (регистрация в каталогах .ru, .com, .de и др.стран). В каталогах статей англоязычных. 2. Куплю сайты (/ru/forum/541017) с pR: дорого! {=- тиц не нужен! -=} | IT - Мысли (http://www.it-thoughts.ru)
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий