sheba

Рейтинг
57
Регистрация
24.03.2010
богоносец:
Иди сам посмотри и покажи тут.
Про =заказ лимузина= ни одной сцылки быть не может! Никто там не сцылкоспамил никогда, всё же чисто из любви к искусству.

Вот ранжировалось по ссылке. А текстовый фрагмент из меты.

В моем примере не в description было дело. Сейчас случайно увидел этот проект и вспомнил.

Ситуация была такая: в description было вхождение запроса, а вот в тексте использовался неявный синоним. Т.е. ранжирование происходило по нему. Сниппет брался из description, как самый релевантный запросу и подсвечивался. Так что да, этот случай ничего не доказывает. Влияние на ранжирование до сих пор нет. Увы)

богоносец:
Не, ну даже подсвечивалось.
Примера сказочник не показал.

Нужен в выдачне дескрипшн с кучей уникальных словосочетаний, удобных для проверки?

К сожалению, сейчас точно не вспомню по каким запросам. Если нужен пруф - посмотри по запросу лимузин а свадьбу / заказ лимузина на свадьбу / аренда лимузина на свадьбу... что-то из этих запросов. Должна быть в выдаче страница сайта bestlimo.ru/auto/limousine/, на которой слово "свадьба" встречается только в description. Запросы скачут со страницы о лимузинам на свадьбу на эту.

Но это не точная информация, могли уже исправить на сайте оптимизацию. Но было так

богоносец:
Примерчик давайте.

Аж сайт, а не документ.

Таким сеошникам остаётся невдомёк, что ранжировалось по ссылке, а показало описалово.

Не снс. Внешних ссылок на документ не было. Внутренних по этому анкору тоже. В сниппете подсвечивалось единственное вхождение ключа в документе.

Заметил это, аудируя проект другого сеошника. По продвигаемому документу была переоптимизация. В выдаче была другая релевантная страница, единственное вхождение ключа, в котором было в description.

Вопреки мнению большинства, влияет. Не раз сайт попадал в выдачу по вхождению только из description

Если в названии домена есть adult-слова, то можете забыть о сео. В остальном, не должно быть проблем

Сейчас уже сложно будет сказать, что пошло не так. В то момент надо было анализировать индексацию, ссылочную и просевшие запросы.

На текущий момент я бы вам посоветовал:

1) Найти страницы, по которым просел трафик. Отобрать несколько десятков самых популярных и посмотреть уникальность контента, а также проверить их на предмет воровства.

2) Проверить search console на предмет ошибок и мер, приняиых вручную.

3) Проверить ссылочную массу на предмет некачественых ссылок

Romanson:
1) У меня на сайте нттернет-магазина на каждой странце товара есть кнопка Быстрый заказ, открывается как здесь http://www.eldorado.ru/cat/detail/71086415/?show=response#customTabAnchor
2) Также есть на каждой странице товара информация про доставку и отзывы (открываются отзывы как на сайте эльдорадо, доставка также открывается).
3) Индексируется страница Корзина - текст Корзина пуста
4) Индексируется страница Карта сайта
4) Индексируется страница Все товары, на которой все товары магазина
Весь этот текст у меня проиндексирован и я думаю, что это плохо для ранжирования. Надо ли закрывать такой текст от индексации?

Ничего из вышеперечисленного закрывать не стоит

NULL:
Складывается впечатление, что они попытались сделать некую функцию семантической свёртки, у которой на входе нормальное предложение, а на выходе - его толкование на расширенном языке Эллочки-людоедки (30 слов у Эллочки и 300 у Яндекса и людоедов племени Мумбо-Юмбо).
Такое впечатление складывается после рассмотрения двумерной упрощённой диаграммы с выращиванием картошки. Что отложено по осям в этом примере? По ординате - картошестость, по абсциссе - марсианистость и космичность?
Если да, то с практической точки зрения первым профит срубит тот, кто заполучит этот словарь из 300 слов (понятий, терминов?) в чистом виде (другими словами это у них что-то вроде ортонормированного базиса) и будет не портянки фигачить (ковровое бомбометание), а дозированно использовать слова из базиса ("точное" оружие).
Жаль, что с 5й страницы по 12ю эту на эту реплику Бурундука не обратили внимания.

Не все так просто. Размерность вектора уменьшают для "упрощения" машинного обучения. Грубо говоря, вы увидите не чёткий "Тайтл" 3×10^ размерности, а его расплывчатое "изображение" 150-размерности после некоторых методов линейного преобразования, если сравнивать с машинным обучением распознования изображений. Но машине достаточно для сравнения.

На этом этапе вы получите, например такой вектор (1, 1, 0...146 числел, 1). Или вот такой: (1000, 23432, 34, 146 чисел, 1). Зависит от линейных операций. Вы понимамаете, что получите не словарь со 150 "терминами", а например, словарь из 150 тыс варианитами терминов (при макс значении любой координаты 1000 при некоторых линейных операциях).

Я уже не говорю о следующих нелинейных операциях с этими векторами. Там точно магия используется.

В теории классный алгоритм. Посмотрим, как будет на практике.

В этой теме кем-то был задан самый главный вопрос: как Яндекс поймёт, что фильм "марсианин" соответствует запросу "фильм, в котором человек выращивал картошу на другой планете".

По схемкам видно, что входной слой строится на триграммах, мешках слов и бинарных словосочетаниях. Причём только по заголовкам, как заметил сам Яндекс. Что это значит? Что если бы мы формировали вектора только на основе входного слоя, то могли бы получить распределение "макимально близких" векторов (правда в 3×10^4 мерном простанстве) по группам, в каждой из которых были бы очень похожие Тайтлы.

Семантическому поиску из поставленной задачи это очень мало помогло бы.

Поэтому, самое важное происходит дальше.

Пропустим линейные преобразования, т.к. они нужны только для "упрощения" пространства для вычислений.

А вот следующие нелинейные преобразования - это и есть учёт всех остальных факторов: текстовые (наверняка где-нибудь в текстах уже упоминались слова картошка и фильм вместе с марсианином), поведенческие, комерческие и прочие... с помощью этих магических нелинейных преобразований и выстраивается новый 300мерный вектор, который максимально близко располагает наш документ с "картошкой в фильме" к группе векторов (уже достаточно близкой друг к другу за счет одинаковых вхождений триграмм и мешков в заголовок) с заголовками "марсианин". Остаётся только исходный запрос "фильм, в котором человек выращивает картошку на другой планете" разложить на триграммы и мешки и сопоставить нашему единственному документу, в котором упоминалась картошка и фильм, который подтягивает максимально близкие вектора, с усиленными в сторону коммерции или поведенческих отклонений группами и выложить в выдачу. Готово.

Имхо, на практике в коммерции мало что поменяется, т.к. там были довольно сильные "координаты" векторов коммерции, траста, геопривязки. Да и люди в коммерции, как правило, знают, что хотят купить и все многословники достаточно сильно будут раскладываться близко к заголовкам изначально по триграмам и мешкам (представьте себе нераскрывшиеся бутоны и шипы в 300-мерном пространстве)

А вот для продвижения инфо запросов с большими хвостами жизнь может усложниться. В раскладке документов о пространству там уже вектора будут напоминать более равномерный "веер" в 300-мерном пространстве. И кто знает, какой косинус угла мкжду многословником и вектором окажется больше?


PS отдельно меню от индексации можно закрыть только тегами <noindex>меню</noindex> да и то только от яндекса.

А как же Ajax или подключаемый js, закрытый от индексации. Flash меню в конце концов! ☝

Всего: 122