upyrj если бы сайты были только для этого опыта - дал бы, не впадлу. Но на них пока есть другие планы.
Насчет шума, я тоже был удивлен. Но не будем забывать о размерах выборки.
Результаты немного на другую тему, но думаю, будет интересно:
1.
запрос::1
Порядок такой: 1-2-3-4-5-X7-7-9-6-10-11-8-12-18-13-14-16
Очевидно, тошнота в знаменателе, текстовая релевантность подавлена.
2.
запрос::1 || %gsgrejhjhksgtоgrrthr
Порядок такой: X7-1-2-3-4-5-7-9-11-6-10-18-9-12-13-14-16
Да, чуть не забыл, X7 - копия сайта с 7 повторениями но с увеличенным в 1,5 раза контентом, соответственно частота ключевика снизилась с 10% до 7,4
С юридической точки зрения - м.б., а с практической - форма "забей текст за собой" решает проблему. Но и тут есть над чем подумать.
Я не вижу дальнейших перспектив в развитие информационно-поисковых технологий в интернете, кроме как использование неявного цитирования, а значит первоисточник так или иначе придется определять. Поэтому авторству на Яндексе - быть.
Посмотрите на главную страницу яндекса - много там про удаление дублей? Погода, пробки, фотки, шмотки... Так что и до авторства дело дайдет, уверен.
Техническая реализация элементарная - автор подтверждает свое авторсто и его дубль становится единственным.
Даю ОЧЕНЬ ТУПОЙ пример, просто для иллюстрации зачем это нужно.
Имеем запрос "слово1 слово2".
ДОПУСТИМ что при вычислении ссылочной релевантности в случае с запросом в нестрогой форме используются аддитивно a) строгие вхождения b)нестрогие c)неполные вхождения и все это как-то нормируется частотой.
Имеем выдачу по нестрогому запросу (слово1 /(-1 2) слово2), колдунщика пока исключаем. Выдача - по сути порядковые значения релевантности для каждого найденного документа. А их тысячи.
Имеем другие выдачи по "слово1 слово2", "слово1 /1 слово2", "слово2 слово1", "слово1", "слово2" или еще как-то. Опять порядковые значения релевантности для тысяч сайтов.
Из предположения знаем, что для каждого документа выполняется след. уравнение (тупо, например, уверен что в Яндексе не так):
ТекстРелев (+/*/...) вИЦ * (k1*a + k2*b + k3*c) = R (релевантность)
a,b,c,R известны, вИЦ вычислима, текстовая релевантность подавляема.
Значит коэффициенты можно подобрать. Подобрав коэффициенты можно оптимизировать анкоры ссылок с точностью до слова, уменьшив т.о. ссылочные бюджеты. Ну теперь понятно?
Не ожидал что в этом разделе придется так разжевывать.
еще как откажется. Тому кто имеет конкурентное преимущество публичная инструкция противопоказана. Иначе бы форум был намного информативнее.
Ага, все прослушивается
Хотите инструкцию по эксплуатации Яндекса?:)
Новость безусловно хорошая.
Kolyaj не так просто подобрать примеры как кажется. Чтобы учесть все факторы нужно проводить эксперимент, а при нынешней скоросте индексации Яндекса это надолго.
Для этого и топик создал. Чтобы высказались те, кто
А для чего еще нужен форум?
Апдейты обсуждать?:)
В анкор-файле - да. Можете на что-то сослаться?
Поправка: и еще как учитываются точные и неточные вхождения при поиске неточного вхождения по анкор-файлу.
мне кажется все кто понимает не очень говорит