богоносец

богоносец
Рейтинг
776
Регистрация
30.01.2007
асессоры, как правило, не оценивают ранжирование документов, не сравнивают документы по релевантности.
...
Асессоры оценивают пары <запрос-документ>

Да это понятно... но представьте, что ТОП (и величина pfound) изменяется, если асессор понимает больше/меньше на тему какого-то запроса/документа, хотя «реальный юзер» может отчичаться и меньшим, и большим пониманием.

не читал инструкцию для асессора Яндекса

Почитываю их уже месяцев несколько.

Они крайне конкретно предлагают проявлять Собственное мнение:

Описание запроса – это Ваше понимание того, что искал пользователь, задавший этот запрос...

Как оценивать?

Ключевое правило - используйте ваш здравый смысл и попробуйте представить себя на месте человека, задавшего этот запрос.
http://www.romip.ru/romip2009/21_appendix_B_WA.pdf
Инструкция для асессоров обычно как раз и содержит правила, по которым нужно относить пары в ту или иную категорию.

Эти легковесные/приблизительные инструкции — могут сделать процесс оценки слишком разумным, хотя оценивающий может быть совсем не в теме оцениваемых документов.

Т.е. по многим причинам неизбежно накопление шума, ограничивающего применимость этих данных.

Для получения функции ранжирования используются методы машинного обучения. Такой подход позволяет достаточно легко добавлять новые факторы,
тем самым развивая и улучшая поисковую систему. http://www.romip.ru/romip2009/15_yandex.pdf

Когда следующей весной тут возникнет тема «Великий Яндекс на парижской конфе заявил, что по некоммерческим запросам умеет отличать рекламу от инфы», это будет означать, что в имеющуюся систему добавилось новых факторов, возможно, требующих соотв. настроек по оценкам асессоров... и вполне вероятно, что ГА надо будет некоторое время (до появления приемлемых результатов) их переварить. И в это время можно будет тут пофантазировать об чём-нибудь частичном.

dimarrik:
Найден по ссылке выдает в том случае, если на вас идет ссылка, но на сайте нет вхождения

/ru/forum/comment/4002420

wolf:
в погоне за так называемой уникализацией анкоров, коммерческие запросы разбавляются чем ни попадя. В итоге коммерческие ссылки оказывают заметное влияние на некоммерческие запросы, т.к. некоммерческие термины активно используются для разбавления коммерческих анкоров.

Т.е. подразумевается, что до этого всего «настройки машинного обучения на основе рипортов асессоров» не вносили необходимых компенсаций в ранжирование «продвигаемых» страниц. Это же клевета на Всемогущего!

Глядя на хвост запросов, по которым заходят, пытаюсь прикинуть — какие из них можно счесть за «коммерческие», а какие за «некоммерческие»? Часто не могу однозначно предположить, чего хотел искатель — товар или инфу про его применение?.. и это при том, что конкретная тема мне известна гораздо лучше, чем асессору, ну и всем тем, кто взялся точно разграничить про всё-всё.

G00DMAN:
4. Обучение проходит на данных от асессоров, данных уже много.

Какова реальная применимость этих данных? Что там с «шумом»?

Истинную релевантность документа запросу пока не возможно просчитать алгоритмически, ее оценивают живые асессоры.

Реальная задача асессоров не в этом...

... ну, сделайте запрос про дебри вашей специализации и оцените релевантность ТОПа, и прикиньте — сможет ли то же сделать обычный искатель / асессор? Да, но со своей колокольни / выполняя инструкцию... и релевантностей получится несколько — все субъективны и без претензий на (не однозначную) истину. Какую же релевантность считать «правильной»?

«Нам не нужен здоровый человек. Нам нужен человек, умеющий жить в этом обществе.»

ПС, как коммерческий проект — обречена быть релевантна не какой-то там истине, а массовому юзеру... его-то мутные реакции и имитируют асессоры. Если полученные от них данные (с умеренным отношением сигнал/шум) позволяют с достаточной точностью выявить какие-то характерные признаки/типы страниц/ссылок... машинное обучение сможет «улучшить».

PrintIP:
Конкретных ответов как я понял не услышу

По причине их невозможности.

PrintIP:
4. Где можно почитать хорошо описанную статью или книгу по внутренней перелинковке?

А вам попадались ещё актуальные книги по сео?

http://www.google.com/search?hl=ru&source=hp&q=site%3Aforum.searchengines.ru+%D0%B2%D0%BD%D1%83%D1%82%D1%80%D0%B5%D0%BD%D0%BD%D1%8F%D1%8F+%D0%BF%D0%B5%D1%80%D0%B5%D0%BB%D0%B8%D0%BD%D0%BA%D0%BE%D0%B2%D0%BA%D0%B0&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA+%D0%B2+Google&lr=&aq=f&oq=

PrintIP:
1.Что будет если я сделаю внутренюю перелинковку своего сайта такой же как и на википедии?

Совсем не обязательно влипание в ТОП...

PrintIP:
2. Есть ли ограничения на кол-во внутренних?

Кажущиеся... на одну страницу ведёт существенно меньше ссылок, чем страниц на сайте | в разделе | в чёрте чём http://me.miralab.ru/2008/11/27/poiskovye-klastery-i-novye-filtry-ot-yandeksa/ от Яндекса

PrintIP:
3. Если нет ограничения то сколько "желательно" иметь внутренних ссылок в статье?

Вы думаете, что в Википедии линковка строится по этому же принципу?

http://www.site-audit.ru/diary/prodvizhenie_krupnyih_saytov__doklad/

зы вы забыли о подборе фраз запросов, которыми типа имеет смысел линковать 🚬

<script language="JavaScript">
document.write("А это JavaScript!")
</script>

Гуглится уже. Частично JS выполняется кагбе?

<script language="JavaScript">

document.write("<",
"span>А это JavaScript!</span>")
</script>
/ru/forum/comment/5093589

G во внешние файлы смотрит... пример показывали /ru/forum/comment/5129270 хотя и не всё ищет, но бывает.

t_o_x_a:
лучше меньше, но качественнее

Это самое качество — оно не с т.з. людей.

Термины, используемые в рассуждениях — лучше бы понимать точно, поскольку без этого делаются выводы, противоположные вероятно-правильным + фобии... убивают всё.

Найти бы компромисс между "хорошо для робота" и "хорошо для людей".

Зачем ?

Можно ли словить какой либо фильтр, обусловленный большим кол-вом ссылок с одним ключом. При условии, что все ссылки при этом условно хорошие.
/ru/forum/comment/5333292
Да скорее всего с анкор листом хрень аналогичная: при достижении определённого порога ссылка с определённом анкором всё меньше и меньше даёт веса по ключу в анкоре.

Вывод: нужно брать только хорошие ссылки без всякой разбавки.
/ru/forum/comment/5355744
ссылки на такую страницу, именно на Бутылку или на %D0%91%D1%83%D1%82%D1%8B%D0%BB%D0%BA%D0%B0

См. код выдачи

<a href="http://ru.wikipedia.org/wiki/%D0%91%D1%83%D1%82%D1%8B%D0%BB%D0%BA%D0%B0" target="_blank"><span><b>Бутылка</b> — Википедия </span></a>

Всего: 13661