Комментарии - Dryoma - Профиль вебмастера - Форум об интернет-маркетинге

8 февраля 2009, 22:04

Gadkiy Putionok:
2+2+2=6

видите ли в чем дело, есть цель конечная у любой задачи.

в приведенном примере это 6.

с Яндексом примерно также.

если вы знаете конечную цель Яши, то вы можете использовать любые алгоритмы, которые эту задачу решат, но из всех алгоритмов лишь один будет неизбыточен.

Если Яша делает избыточный алгоритм, то потом он его исправляет (делает статические параметры динамическими, связывает одни параметры с другими). Я делаю свой алгоритм и вижу, что Яша делает те же шаги, поэтому иногда очень точно получается что-то предугадать. Причем делает он это четко по заранее известным принципам, которые описаны в соответствующей литературе.

Это вы не знаете, что делает Яша и судите о его алгоритмах исключительно по экспериментам дефакто. Для вас каждый апдейт непредсказуем, а мне видно для чего он, понимаете?
Не все конечно...

Поэтому я и призываю вас. ДЕЛАЙТЕ свой яндекс, тогда многие вещи вам станут понятны легче.

Конечная цель --- релевантный (соответствующий, информативный, интересный) поиск --- подразумевает понимание смысла запроса, смысла текста и последующий выбор наилучшего документа. Если бы Яндекс научился это делать, то деятельнсть сеошников не могла бы помешать Яндексу. Действительно, чтобы провести сайт в топ, надо было бы написать более релевантную статью, но тогда Яндексу нечего было бы сопротивляться --- вы написали хорошую статью и теперь пользователь более доволен результатами поиска.

Но, эта цель на настоящий момент недостижима. Работники Яндекса вручную, на глаз, определяют наиболее релевантные документы, и определяют набор характеристик, сопутствующий наиболее релевантным из них. И именно этот набор характеристик отслеживается машиной, но он не является доказательством релевантности, а лишь ей сопутствует. Поэтому хитрые сеошнеки, угадав набор параметров, отслеживаемых Яндексом, могут на место релевантного сайта подсунуть что угодно.

Поэтому, я просто уверен, что нет идеального алгоритма, а тем более что он описан в литературе, и Яндекс ему следует и воплощает шаг за шагом.

Опять копает про текстовую релевантность

7 февраля 2009, 08:52

Тимон:
Не соглашусь с вами.

Например, у нас есть 5000 сайтов, где встречаются три слова "левкипп демокрит анаксимен". Из этих 5 000 сайтов есть 100, где также встречается слово сайт. Плюс к этим 5 000 есть что-то релевантное от быстроробота.
На запрос (левкипп демокрит анаксимен)~~сайт Яндекс отбирает сначала 5000 сайтов, потом исключает из них 100 + остается быстроробот
На запрос (левкипп демокрит анаксимен сайт)~~сайт Яндекс отбирает сначала 100 наших сайтов + быстроробота; затем исключает 100 сайтов, т.к. они содержат слово "сайт"

То что вы пишете --- это если слово "сайт" не выпадает из кворума. Я уверен на 100 процентов что оно там таки выпадает, но почему так мало сайтов --- объяснить не могу. Например сейчас у меня по этому запросу 10 сайтов и ни у одного нет пометки, что он найден столько-то часов назад.

Опять копает про текстовую релевантность

6 февраля 2009, 13:28

wolf:
Тем более, что запрос

левкипп демокрит анаксимен

дает большее кол-во документов ;)

Да, по логике вещей, если слово "сайт" просто выпадает, то запрос (левкипп демокрит анаксимен сайт)~~сайт должен давать столько же результатов сколько и (левкипп демокрит анаксимен)~~сайт, но этого не происходит.

Повысить трастовость своего сайта

5 февраля 2009, 21:24

А у кого-то есть убедительные аргументы в пользу того, что траст вообще существует? У одних он векторный, у других --- скалярный. А вам не кажется, что вы просто все что непонятно в работе Яндекса называете "трастом"?

Опять копает про текстовую релевантность

4 февраля 2009, 20:58

_S_:
Ну, скажем, сейчас там много чего накручено - например мягкость, расстояния, цитаты и тд. Кврорум есть, но как уже было сказано выше - не для всех запросов.

как раз расстояния уже не важны (т. е. сайты с большими расстояниями между словами из запроса не выпадают. Как большие расстояния отражаются на релевантности --- не знаю, но скорее всего плохо)

Опять копает про текстовую релевантность

4 февраля 2009, 15:29

именно. Запрос означает, что из множества сайтов найденных по запросу

левкипп демокрит анаксимен сайт

надо вычесть те сайты на которых есть слово "сайт" (про ранжирование молчу, так как все операторы, в т ч и "~~" его меняют). Таким образом, среди страниц, найденных по запросу

левкипп демокрит анаксимен сайт

есть те, которые содержат "левкипп", "демокрит", "анаксимен", но не содержат слово "сайт"

Опять копает про текстовую релевантность

4 февраля 2009, 14:15

вбейте

(левкипп демокрит анаксимен сайт)~~сайт

2 страницы найдено, значит "сайт" выпадает

Разъясните термины плз )

4 февраля 2009, 14:09

inetessentials:
а яндекс официально признал термин тошнота?

Что признавал Яндекс --- мне неизвестно. Могу сказать то что из экспериментов Миныча и ХРНС был очевидно, что есть такой коэффициент. Как его называть --- неважно.

Опять копает про текстовую релевантность

4 февраля 2009, 12:43

а что такое быстророботовская выдача?

По поводу кворума --- он есть, но срабатывает очень редко, в особенности на "естественных" запросах.

Разъясните термины плз )

4 февраля 2009, 12:05

По поводу тошноты. Пусть у нас однословный запрос. Тогда текстовая составляющая релевантности сайта запросу пропорциональна кол-ву вхождений ключевого слова и обратнопропорциональна корню из кол-ва наиболее частотного слова на странице. Корень из кол-ва наиболее частотного слова называют ТОШНОТОЙ (в случае, если наиболее частотное слово встречается менее 7 раз, тошнота равна корню из 7). Таким образом, большой тошнотой обладают или заспамленные ключевыми словами тексты или просто длинные тексты. Все что сказано было справедливо до 2007 года, но тошноту учитывают до сих пор. Как тошнота влияет на выдачу сейчас по крайней мере мне неизвестно

Open AI тестирует память для ChatGPT

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

Dryoma