wolf
Вы можете спрогнозировать изменение посещаемости сайта после снятия внешних ссылок?
Ваш пример хорошо продемонстрировал, как некоторые участники темы пытаются вывернуть факты на свой лад. :)
Автор разве обмолвился, что на графике один лишь Яндекс?
Что касается Яндекса для проектов с богатой семантикой - сотни анкоров с уникальными терминами позволяют собирать НЧ, супер-НЧ запросы. Может ВЧ/СЧ запросы после снятия ссылок и останутся при прежних позициях, но общий трафик просядет.
Ну, исключая [запрос 1], мы не влияем на то, в какие группы попадут [запрос 2] и [запрос 3]. Оценка "продвигаемости" запроса для типа сайта уже другая задача. По мне, так лучше не изменять семантику на выходе, уменьшая количество запросов.
И повторюсь, для неконкурентных запросов определение подкатегории сайта не несёт смысла, тк сильная обратная связь от других факторов.
Объясните, с чего вдруг точность должна возрасти?
Вы хотите кластеризовать семантику, или определить релевантность [запрос:категория сайтов]?
Надуманную проблему ничто не решит :)
Вы почему-то решили, что в данной задаче тип сайтов значимый фактор, отбросив другие.
Допустим [запрос 1], [запрос 2] ... [запрос n] отлично собираются в группу. Тут большее значение играют запросные факторы - мы ищем связь между запросами (хорошо собрались в группу - сильная , нет - слабая), а Вы хотите добавить условие - но это уже другая задача.
Для кластеризации более важными могут быть другие факторы (семантическая близость запросов), чем группы сайтов.
При этом, добавление группировки сайтов непосредственно в кластеризатор может ухудшить конечный результат.
На мой взгляд, изначально семантику можно кластеризовать, а затем дополнительно присвоить запросам коэффициенты релевантности, на основе групп.
Shlackbaum
Почему Вы вообще решили, что для кластеризации запросов имеет значение определение типа сайтов?
Видимо, мы разные WS используем :o
Дополнительно можно учитывать видимость группы по запросу (для Вашего примера с [форд фокус цена] группа "любительские сайты" получит низкий коэффициент) и отсеять неподходящие запросы.
Проблема, я думаю, будет в другом - бОльшая часть семантики - это НЧ запросы. Для них значение типа сайта практически не будет играть роли - будут рулить классические текстовые факторы. Следовательно, сужение выборки только до определенной группы сайтов даст кривые результаты. Ну или:
Гениально :)
Так я не утверждаю, что подобная оптимизация обеспечит топ. Тема об альтернативной постановке ТЗ на копирайт. А уж нужен текст или нет - решать вам :)
Я такого не заметил, где-то даже был рост после съема ссылок (позиции до отката):