богоносец

богоносец
Рейтинг
776
Регистрация
30.01.2007
Turbo:
Если страница вашего сайта попадает в список асессоров с максимальной релевантностью, то первое место вам обеспечено независимо от расколбаса выдачи.
...
не наблюдалось, но это логично. Если по этой точке настраивается алгоритм, то при подставлений вполне конкретных значений этой точки, мы получим то что было задано асессором (либо очень близкое значение).

Предположим, что страничку оценил не один асессор, а десяток. Средняя оценка может оказаться не высшей.

<!--

в действительности, оценки людей — это нечто подверженное случайностям и непредвиденностям (поэтому бестолку вычислять релевантность слишком уж точно).

http://www.romip.ru/romip2009/01_organizers.pdf
было обнаружено расхождение в понимании задачи асессорами и участниками дорожки, которое не было регламентировано правилами. В частности, асессоры предполагали, что они ищут ответ для “реальной” юридической проблемы, а участники решали задачу текстового поиска.
...
участники считали все редакции одного документа релевантными, а асессоры - нет.
...
эксперт отметил, например:
Документы недействительны...
Есть “другой” новый закон/нормативный акт, который регламентирует этот вопрос. Этот факт отсутствует в результатах, но асессор “знает” о его существовании.
“Проект” закона бесполезен, нужен окончательный принятый текст.

Шум усредняется и сглаживается на больших выборках, при этом не очень важно: один запрос оценивается одним асессором или многими.

-->

Предположим невообразимое: все асессоры поставили высшую оценку паре <запрос-документ>, но в процессе настройки формула ранжирования может получиться такой, что конкретный документ не будет первым даже на обучающей выборке. А в действительности ПС обрабатывает запросов на три порядка больше, чем оценили ассессоры. И ПС решает задачу ранжирования не одного документа.

1) Если по паре "запрос-документ" настраивается алгоритм и там явно сказано релевантность 0, то хоть 10000 ссылок поставь ничего не сделаешь, там и будет 0,

Там будет (0 ± 1), если значения оценок {0|1|2|3|4} отрицательные значения оценки вообще не определены, считать ошибку надо иначе... так что увеличивайте количество оценок, поскольку надёжность одной единственной — минимальна. А фонд оплаты труда ограничен.

Оценка асессора — вероятность (всегда < 100%), что документ соответствует запросу с т.з. асессора, хотя так и остаётся неизвестно, что хотел искатель.

Релевантность с т.з. ПС — вероятность (всегда < 100%), что искали именно это...

Криптография пытается превратить сигнал в шум или в почти шуме заметить сигнал. У ПС задача проще...

AiK:
есть параметры, монотонное изменение которых ВСЕГДА приводит к скачкообразному изменению релевантности

Это не противоречит http://ru.wikipedia.org/wiki/SVM#.D0.9F.D0.BE.D1.81.D1.82.D0.B0.D0.BD.D0.BE.D0.B2.D0.BA.D0.B0_.D0.B7.D0.B0.D0.B4.D0.B0.D1.87.D0.B8

newbeee:
ведь какая-то "игла" для клиента нужна (это даже представители миралинкса говорят)

Покажите где или что именно сказали.

Не волнуйтесь, я совсем не фанат статей... считая их униКальным околоссылочным текстом.

Psycho:
клиенту необязательно знать, чем его двигают - ему нужно знать, что пока он платит, он в топе...

Скольких клиентов эта фраза послала обратно? 🚬 В подписи-то Продвижение по НЧ.

Может, лучше бы ему знать, что пока платит — его сайту делают лучше?

_S_:
вообще релевантность - давно перестала быть первоочередной задачей яндекса, а задача - "счастье пользователей"

людей-реальных

Официальные метрики РОМИП 2009
Большинство метрик, применяемых в современной оценке текстового поиска, основываются на отношении релевантности документа запросу.
... это отношение имеет скорее психологическую природу и устанавливается прямым опросом экспертов-оценщиков.
Ceres:
Можно дать объявление здесь на серче - ищу связь с ассессором - глядишь подфартит он стукнется в личку и предложит свои услуги

Понадобится большая куча асессоров

есть статистика, которая показывает, что процент перекрытия релевантных документов у двух разных асессоров всего лишь 40%.

Надёжные результаты именно на больших выборках... людей.

А все асессоры не смогут физически передать все документы, запросы и оценки.

А даже если смогут, то что? Названия факторов уже известны?

Str256:
Садовский вроде говорил, что ассессорами являются волонтёры разных профессий, а не число программисты или математики.

Ну они же не для себя выдачу делают, понимая всю свою безнадёжную испорченность.

А ссылки не найдётся на то, что конкретно говорилось, да ещё про волонтёров?

Вроде бы только про отсутствие требований...

praide:
Для работы над СДЛ нужны даже не столько ресурсы, сколько заинтересованные в теме грамотные специалисты.

Криво формулируете!.. слова говорят о состоянии говорящего.

Вспомните свой единственный СДЛ, особенно стадию написания контента во всех ощущениях...

  • Специалист не пойдёт в чью-то работу над сайтом, кроме как за деньги, которых у вас конечно же не хватит.
  • Качественный контент крайне редко получается через слово «надо».
  • Иногда «контент хочет появиться», а специалист его объёмно чувствует и формулирует в словах... и этот текст собирает хороший нч трафф.
  • Написание текстов и создание сайта — две разные стадии, напрасно переставляемые местами. В процессе создания сайта ранее написанные тексты можно только слегка уточнять.

Есть люди, пишущие, переводящие... вываливающие иногда по мегабайту текстов... делается сайт с хорошо видимым упоминанием их имён, условий, пожеланий, манифестов... и они довольны, что за них сделали то, чего они сами делать не умеют. Уже парочку таких чужих трудов|недоделок превратил в сайты. Но начинал именно с написания текстов...

Алгоритмы контекстно-зависимого аннотирования Яндекса на РОМИП-2008

но там только основные принципы, а к конкретике додумывайте сами, как приложить.

Доры пролазят в топ скорее всего по причине того, что на основании расчитанных 245 параметров они по версии алгоритма получаются достаточно релевантными

конкретному запросу.

либо алгоритм не справился, либо база асессоров маловата и не учитывает какие-то факторы

Если какой-то набор факторов регулярно встречается и у хороших страниц, и у плохих — он не может быть надёжным, остаётся надеяться, что при достаточной выборке — алго построения модели найдёт другой набор факторов... но если плохие страницы не используют чего-то слишком массово, то и отсеять их модель ранжирования не сможет... при ограниченной выборке запросов.

Может быть ещё и учётчик кликов искателей дополняет это всё.

Интересные наблюдения:
1) Если страница вашего сайта попадает в список асессоров с максимальной релевантностью, то первое место вам обеспечено независимо от расколбаса выдачи.

Подробнее можно? Как именно наблюдалось?

Если асессор сказал "ноль", то в идеале все коэффициенты в формуле должны настроиться так, что в результате для этого документа будет значение, очень близкое к нулю

по конкретному запросу (в обучающей выборке). А по реальным?

wizzer:
Главное чтобы ключ отсутствовал на странице акцепторе

/ru/forum/comment/4002420

НПС — уже не значит, что текста на странице нету.

Это работа алго аннотирования...

... можете ещё понаблюдать не за самыми длинными ссылками, а за теми, в которых самые редкие слова (отсутствующие в тайтле страницы).

Т.е. страницы к индексации не запрещены и с сервера не удалены, поэтому запросы на удаление из выдачи... можете не повторять.

NoHate:
заставить в кратчайшие сроки ВСЕ ПС пройтись по сайту и скушать новое содержимое?

Не заставить, а предложить...

со своего ЖЖ или бысто индексируемого блога поставьте ссылок на эти страницы, есть некоторая вероятность... или ждите (нормальный искатель в сохранённую копию не лазиет, а попав на страницу уже той инфы не видит).

все легко, когда кошелек толстый. Любой школьник может с такими начальными данными быть "сеошником". А вот попробуй продвинь без денег.

Тезисы спорны.

Пример (но старый). Сотни КВ текстов, без покупки ссылок, 400--600 уников (по СЧ < 15%) в основном НЧ, за месяц ~3000 разных запросов, только по нескольким десяткам из них была какая-то типа оптимизация и г-ссылки.

Оставил вам ссылки на статистику раскрученных сайтов (можете и сами в своей теме поискать), не хотите убедиться, что основной трафф собирают запросы с частотой от 1/мес. Вот и майтесь в заблуждениях, конкурируйте в толпе таких же. Так уж оно неизбежно кагбе.

Скажем так, если все получиться, пускай даже через полгода

А напишите тут, чего именно хотите. Чего там на сайте? Или это секрет, как и запросы?

Не хотите получить ответ на то, что дойдёт до вас после полугода?.. ну и ладно.

на фасткейвордс и ужаснулся, вместо 50 к в яндексе там и до тысячи не дотягивает.

Там не на это предлагалось посмотреть, самое интересное вы наверное опять просмотрели.

Читайте прикреплённые темы /ru/forum/183081 там много чего полезного, на что внимание обращается не сразу.

У Яндекса нет понятия говносайт. Это определение ввели оптимизаторы для оценки сайта на глазок.
/ru/forum/comment/4476590

. .

Всего: 13660