Доказательство того что яндекс учитывает окружение ссылок

di_max
На сайте с 27.12.2006
Offline
262
#211
MiRaj:
2) Тематику отдельного документа невозможно определить, тем более "на лету".

Странно... Тематичность, в данном случае - документа, определяестся тексто-смысловыми соотношением принадлежности к какому-либо роду деятельности человека (раздела ЯК). Ибо, слова - есть не более чем ОБОЗНАЧЕНИЕ сущности или действий объекта. А анализ идет именно слов, как набора букв. Контескто-сысловая составляющая появляется при сопоставлени 2-х и более слов. (^Уточнил: Исключая частицы, союзы и местоимения) И этот анализ вполне реально осуществить.

И почему "на лету"? Критерии релевантности данного документа конкрентому слову(ключу) определяются, имхо, ДО выдачи в серп...

^ Внес уточнения...

// Все наши проблемы от нашего не знания...
юни
На сайте с 01.11.2005
Offline
933
#212

Я сделаю паузу, пожалуй. Ещё четыре блюда для размышления, после неравной битвы с аттачментами, могут привести к несварению мозгов. :)

Что-то остальные притихли? :) Дайте сотрудникам Яндекса новых ощущений, у них же ломка информационная сейчас начнётся, от такой тишины.... :) и от трёх-четырёх гулких голосов в пустоте :) :)

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
Р
На сайте с 23.05.2006
Offline
258
#213
юни:
Что-то остальные притихли? :) Дайте сотрудникам Яндекса новых ощущений, у них же ломка информационная сейчас начнётся, от такой тишины.... :) и от трёх-четырёх гулких голосов в пустоте :) :)

Не начнётся, у них иммунитет..

MiRaj:
нет такой.
Разработчик, повторю еще раз
1) Тематика (принадлежность разделу ЯК) определяется только для сайтов.

Факт? Тогда цитату, пожалуйста..

MiRaj
На сайте с 03.07.2006
Offline
509
#214

di_max, no comments.

Разработчик, уточню - для сайтов и отдельных документов, разделов описанных в ЯК

Муркетолог. 100 пресс-релизов с прямыми ссылками за 150 баксов? Легко! (http://b2blogger.com) Статейный маркетинг - лучшее лекарство от Минусинска! (http://miralinks.ru)
pro-maker
На сайте с 08.12.2003
Offline
281
#215
MiRaj:
1) Тематика (принадлежность разделу ЯК) определяется только для сайтов.
2) Тематику отдельного документа невозможно определить, тем более "на лету".
3) Тематика сайтов учитывается только при расчете тИЦ
4) Для документов есть термин релевантности ключу. Не факт, что релевантность расчитывается так же как и релевантность при ранжировании в СЕРПЕ. К примеру, могут не учитываться внешние факторы (только релевантность контента).

MiRaj, могли бы объяснить логику, на основании которой сформулированы эти тезисы?

MiRaj
На сайте с 03.07.2006
Offline
509
#216

pro-maker, постараюсь в двух словах.

1,2) Делать выводы о тематике документов по тематике сайта, их содержащего, нельзя (сайт может содержать документы совершенно не соответствующие тематике сайта). Определить тематику (раздел ЯК) для каждой страницы тоже проблемно - за примерами бегать далеко не надо.

3) Использовать тематическую близость (или смежность) сайтов при ранжировании можно, но на текущий момент такого не замечено (причин много, в т.ч. см п.1). Использование тематики при подсчете тИЦ - факт.

4) тут комментировать нечего, итак все предельно ясно написано :)

Ceres
На сайте с 28.09.2004
Offline
389
#217

Алло, гараж!!! :) Если несколько десятков нетематических жирных морд могут поставить сайт в топ - о какой тематичности вы тут пишете?

Там чу-де-са! )
MiRaj
На сайте с 03.07.2006
Offline
509
#218

Ceres, утро доброе :D

Последние три страницы обсуждается возможность учета "тематики".

А то что она пока не реализована - никто и не спорит :)

i_am_sorry
На сайте с 18.09.2005
Offline
19
#219

вИЦ есть вИЦ его ни кто не отменял ... потому и морды до сих пор ценны ...

Но почему не учитывать к примеру вхождение анкора к тексту ссылающейся страницы ... и не давать такоим ссылкам усиливающий коэффициент?

Я не ставил экспериментов, но как владелец доноров могу подтвердить визуальный эфект :)

- (http://www.doskasearch.ru)С уважением к Вашим достижениям ...
pro-maker
На сайте с 08.12.2003
Offline
281
#220

Для начала хотелось бы напомнить общее определение тематики, предложенное Спарком:

Тематика - зона выборки документов, относящихся к определенной теме
Т.е. набор документов, соответствующий определенным условиям. В прикладном применении техническая реализации тематики зависит от контекста. Например, в контексте Я.Каталога это м.б. двумерная матрица, в ячейках (рубриках, подрубриках) расположены списки сайтов, "тематическая близость" в которой м.б. выражена растоянием между рубриками. А в Я.Директе тематика м.б. реализована как лексическая и тематическая общность, что позволяет показывать рекламу по соответствию запроса ключевикам, т.е. лексическому совпадению.
MiRaj:
1) Тематика (принадлежность разделу ЯК) определяется только для сайтов.
2) Тематику отдельного документа невозможно определить, тем более "на лету".

MiRaj:
1,2) Делать выводы о тематике документов по тематике сайта, их содержащего, нельзя (сайт может содержать документы совершенно не соответствующие тематике сайта). Определить тематику (раздел ЯК) для каждой страницы тоже проблемно - за примерами бегать далеко не надо.

Цитата с доклада Яндекса на РОМИП-2006:

Для расчета похожести нам нужны какие-то теги – признаки до-кументов, по которым мы будем определять похожесть. Для РОМИПа мы использовали два набора тегов. Первый набор тегов – автоматическая классификация докумен-тов по темам Яндекс.Каталога. Для классификации мы использовали алгоритм Байеса в интерпретации Пола Грэма [3] Коллекция доку-ментов, на которой настраивался автомат, сформирована по прин-ципам, описанным в [4]. Каждому документу автомат приписывает одну тему.

Для прохода с тегами c классификацией по каталогу применялись коэффициенты в диапазоне от -0.3 до 0.25

Для коллег, которые не могут поверить в возможность классификации тематической документов, можно еще сослаться на Александра Садовского, который на последней оптимизаторской конференции это подтвердил. Насколько тематика документов задействована в поиске, конечно же, неизвестно, думаю, что вполне могут классифицировать документы на стадии индексирования, а в поиске документам по степени тематической близости с запросом на лету присваивать соответсвующие коэффициенты. Хотелось бы также напомнить о недавнем обсуждении тематики документов.

MiRaj:
4) Для документов есть термин релевантности ключу. Не факт, что релевантность расчитывается так же как и релевантность при ранжировании в СЕРПЕ. К примеру, могут не учитываться внешние факторы (только релевантность контента).

Честно говоря, не понял, зачем поисковику дважды рассчитывать релевантность по контенту, а м.б. и просто невнимательно просмотрел предыдущее обсуждение. Очень похоже, что релевантностью коллеги из Яндекса оперируют очень разносторонне, например, цитата Михаила Маслова:

К проданным ссылкам Яндекс относится в общем случае плохо, поскольку они как правило для пользователей нерелевантны.
Т.е. ведущий разработчик поисковика заявил, что могут оценить степень близости анкора и контента донора. :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий