Владимир-C

Рейтинг
463
Регистрация
02.02.2006
Dweep:
Можно для подстраховки туда еще noindex и nofollov всунуть

Не помешает.

А вообще-то от такого шифрования толк есть, как полагаете?

Изучая литературу по дизайну, я несколько раз встретил тезис о том, что в настоящее время относительные единицы стали предпочтительнее, ибо многие пользователи устанавливают персональные настройки браузера. То есть в относительных единицах сайт лучше сохраняет свою структуру.

Вы с этим не согласны?

CyberForce:
У вас какая реклама то стоит на сайте? Если pupunder, то из-за него, а если другая, то причина не в этом...

Я тогда искал способы монетеризации сайта и ставил все подряд: 1under, lovecash, popuptraf, popunder, ostapcash... Не все сразу, конечно же, а поочередно. Ну, как еще узнать, что будет иметь отдачу именно на твоем сайте?

Потом вдруг резко упала посещаемость - с десяти тысяч до четырехсот человек в сутки. В лсновном это были низкочастотники, поэтому точно определить, на какие позиции откатился сайт по каждому запросу, довольно сложно. Но по основным ключевым словам сайт не выдается вообще, хотя все страницы в индексе.

Похоже на фильтр?

Во интересная картина: одни профи пишет, что бред, а другой - что так оно и есть. Получается, что единого мненя у гуру не существует...

Только персональный?

А обычный поиск этого не делает? Странно...

А Гугль?

Сегодня скачал Вашу программу Ice Core Text Analyzer. Это не первая программа такого назначения, которую я пробую, и хочу сразу отметить, что от всех прочих программ, известных мне, она отличается в лучшую сторону.

Дизайн отличный. Но главное - чувствуется, что автор прекрасно разбирается в проблеме. Прога сходу прошла пару тестов, на которых другие программы споткнулись.

Hkey:
Разная длина шинглов это раз.

Важность этого параметра я прекрасно понимаю! Поэтому приведенные мною цифры относятся к шинглам одной длины.

Очень различные результаты работы разных программ!

Сравниваю две пары тестовых созданных вручную клонов. В одной паре тексты достаточно близки, в другой более уникальны. Сервис http://www.wsgu.ru/servis/copy.php дает 57% и 2% неуникальности. ShinglesExpert дает 52% и 3%. Программа ShExpertPro дает 17% и 15 процентов.

И непонятно, кому верить...

Спасибо, теперь дело прояснилось!

Читал. Но, как говорится, каждое слово понятно, а что хотели сказать - нет.

Вот это:

3. Вычисление хэшей шинглов с помощью 84х статических функций

Вот этот этап самый интересный. Принцип алгоритма шинглов заключается в сравнении случайной выборки контрольных сумм шинглов (подпоследовательностей) двух текстов между собой.
Проблема алгоритма заключается в количестве сравнений, ведь это напрямую отражается на производительности. Увеличение количества шинглов для сравнения характеризуется экспоненциальным ростом операций, кто критически отразится на производительности.
Предлагается представить текст в виде набора контрольных сумм, рассчитанных через 84х уникальные между собой статические хэш функции.
Поясню: для каждого шингла рассчитывается 84 значения контрольной суммы через разные функции (например SHA1, MD5, CRC32 и т.д., всего 84 функции). Итак каждый из текстов будет представлен, можно сказать, в виде двумерного массива из 84х строк, где каждая строка характеризует соответствующую из 84х функций контрольных сумм.
Из полученных наборов будут случайным образом отобраны 84 значения для каждого из текстов и сравнены между собой в соответствии функции контрольной суммы, через которую каждый из них был рассчитан. Таким образом, для сравнения будет необходимо выполнить всего 84 операции

Что конкретно мы делаем?

Для КАЖДОГО шингла первого текста посредством 84 функций рассчитываем 84 значения контрольной суммы.

И для второго текста аналогичным образом рассчитываем 84 значения контрольной суммы.

Так?

Всего: 1963