Моё личное мнение - что у нас слишком мало информации, чтобы уметь делать однозначный вывод при проставлении ссылки, какой текст лучше использовать - уникальный или уже имеющийся. Вот из Ваших умозаключений выходит, что до достижения некоего порога по количеству ссылок выгоднее ставить неуникальные, при превышении порга - уникальные. Величину порога мы не знаем, а он, в добавок, еще может быть и динамическим. Какие точно ссылки из показываемых оператором link, попали в анкор-файл (ведь не секрет, что анкор-тексты сквозняков фильтруется) - мы не знаем. Т.е. мы не знаем ни сколько ссылок с каждым анкор-текстом учитываются при ссылочном, ни величины порога (если он существует в природе ;)). А вдруг есть еще какие-то факторы? Может, порог - это не скаляр, а вектор с набором значений для каждого уникального анкор-текста (другими словами - каждого пассажа анкор-файла), зависящего, например, от веса пассажа? Выходит у нас нет данных, на основе которым мы можем выработать стратегию употребления анкор-текстов.
Всё нормально увязывается. "Тяжесть" отдельных терминов играет роль в многословных запросах. Мы же рассматривали идеальный случай - однословный запрос, который никак ехидно не переколдовывается. Но даже в идеальном случае оказалось, что понятия абсолютной оптимальной плотности в виде некоего числового значения не существует. Что уж говорить за остальные...
На основании тех результатов, что у Вас были, такой вывод делать некорректно.
Я вообще удивляюсь, как народ бодро делает мощные выводы на основании спорадических наблюдений за двумя-тремя сайтами.
Ок, понятно. А есть ли у Вас оценка для порогового значения количества ссылок (которое Вы в примерах условно назначаете, как 300)? Статическая ли это величина или зависит от каких-то параметров страницы реципиента (например, ВИЦ)?
Гм... Похоже мы с Вами под пассажами разные вещи понимаем. Я под ним имею в виду фрагмент текста анкора (предложение, ограниченное сверху по количеству слов в нем), являющийся уникальным по оношению к другим фрагментам. Вы, похоже, понимаете уникальный термин.
Вот объясните мне на ваших арбузах, для вклада по слову "арбуз" будут ли различаться анкоры для новой ссылки "сладкие арбузы" и "кислые арбузы" при условии, что до сих пор поисковику известны только ссылки с анкорами "сладкие арбузы"?
Ух, шайтан, надо пораскинуть мозгами. :)
А с внешней, что - не можете? ;)
А если есть и другие слова в тексте ссылки -тоже не можете?
Гм, любопытно. О том, что чем больше словопозиций, тем лучше, можно догадаться из фраз
и
на http://company.yandex.ru/articles/romip2004.xml
А если предположить, что нормировка tf происходит не по длине документа, а по максимальной tf, то действительно получается, что для того, чтобы получить максимум суммы контрастностей, максимизировать надо эту нормировку, т.е. минимизировать разницу между tf термина и tfmax максимально частотного термина, т.к. значение idf для конкретного термина - величина постоянная в том смысле, что мы на нее мы на нее повлиять не можем. Выходит, всё выглядит логичным, коллега. :)
Т.е. Вы можете построить запрос так, что в выдаче документ с будет с пометкой "Найден по ссылке", не смотря на наличие ключевого слова в его тексте? Я правильно понял?
Вашей теории нашел только зависимость от числа анкоров:
(кстати, Вы так и не ответили, что подразуемевает под объемом анкор-файла - суммарное количество всех ссылок или же количество различных вариаций ссылок, если второе, то тогда наоборот - чем меньше вариаций, т.е. чем больше одинаковых ссылок, тем лучше) и зависимость от от размеров пассажей, в которых нашлись добавляемые слова. Каким боком ко второму предположениею имеет отношение уникальность ссылки - ума не приложу.
Ну дык, может, просто совпадение. :)
Поди ссылочек там прикупили, а они никак не заработают? ;)