G00DMAN

G00DMAN
Рейтинг
122
Регистрация
19.04.2008
seolink74:
Специально ради Вас и Вашем докладе о матрикснет еду завтра на конференцию..

Ну я надеюсь, что Вы не рассчитываете получить формулу вида "два раза в тайтл + 10 в боди, из них 2 в стронге, 2 в анкорах и 2 в других словоформах - и вы в топе"? :)

G00DMAN добавил 30.06.2010 в 01:43

Tarry:
Имеется ввиду ссылки с первого экрана "сильнее" чем из подвала. Вполне рабочий критерий. По крайней мере гораздо реалистичней влияния процента отказов.

Кстати да, не плохой фактор. Я такой использую в этом году (в числе других) для выполнения поисковых заданий на РОМИПе. Вроде не плохо работает, хотя асессоры еще не оценивали. :)

ApokalipsYs:
Я предлагаю всем принять участие в мозговом штурме.

ApokalipsYs, Вы слишком много всего намешали в кучу. И верного, и спорного и не верного. Как-то влом все это разгребать подробно, да и зачем? Что Вы хотите в итоге получить? Все простые факторы, влияющие на ранжирование? А Вы разве не в курсе, что корреляция каждого из них с выдачей (тупо посчитанная по большому числу топ-10) очень низкая? Ну, кроме "артефактов". :)

Можно заметить, что из значимых для ранжирования факторов:

  • есть факторы пары (запрос, документ), по которым происходит обучение функции ранжирования. Далеко не все из них такие простые, как у Вас, многие - это достаточно сложные формулы.
  • теоретически есть факторы, слабо коррелирующие с группой, указанной выше, но имеющие не плохую корреляцию с ранжированием
  • есть факторы, которые не участвуют в функции ранжирования, но участвуют в фильтрах, накладывающихся на выдачу после вычисления релевантности
  • есть еще какие-нибудь факторы

Кроме факторов для ранжирования есть еще факторы для индексирования, те же АГС, аффилиаты и т.д.

Это все разные группы и мешать их в кучу не стоит.

IndexSa:
Таких примеров море, там ещё не хватает пары помоек с забытых сайтов.
Ихмо издержки борьбы со спамом привели к таким результатам, а по мерилкам яндекса выдача улучшилась значительно. Вот такие пироги :(

Выдача на самом деле улучшилась. Особенно в регионах, даже многие региональные оптимизаторы тащатся, реально стало что-то местное искаться не выходя с 1-й страницы и без галочки.

IndexSa:
G00DMAN, Так было же лучше, это горе от ума называется. Им бы ещё снипеты даунгейдить, так то юзер видит что там купить платье и купит квартиру (вместо сайта). В результате на эти ссылки не жмут, а так бы плевались в монитор :)

Ну было не лучше, если в среднем. Понятно, что косяки будут всегда и в целом их будет много, т.к. обучалка все же малонаучным методом подгонки проходит. Пока науки не хватает. :(

Данный конкретный случай на самом деле совсем не простой, сложно такие обрабатывать, смысл документа не прочекать, тематичность в общем случае тоже не прокатит, легко можно привести контрпримеры.

Если Яндекс такой тупой, а Вы такой острый, то предложите малозатратный алгоритм, отсеивающий такие страницы. Только не именно эту, а в целом по индексу.

Rookee:
С самого начала в сервисе ROOKEE предусмотрен механизм сценарив. А в ближайшее время функционал системы усилится новым принципом работы со сценариями продвижения. У пользователей появится возможность настроить правила сценария (фильтры) с учетом поэтапного подхода к закупке ссылок - т.е. сделать стратегии продвижения.

Отличная идея, особенно для молодых сайтов.

seolink74:
То есть за топ 30 рендом без участи алгоритма ранжирования? Чуть ранее я отвечал...повторюсь.


Может это и так но рост сайта за топ 30 происходит плавно.. 200-120-70-43-33-22-27-35-18-15-24-12-8 И никак не 200-29-и далее к первому месту(рост позиция для примера из головы но примерно так и происходит)

Почему рандом? Нет, релевантности там так же расставляет матрикснет. Но на 4-й странице он не обучается, поэтому и предъявы не катят. :)

seolink74:
Запрос аренда самолета

Поисковая система должна выводить документы по релевантности. По степени качества выдачи можно оценивать качество работы алгоритма.

Подскажите.. Чем документ расположенный на 33 месте релевантнее документа расположенного на 38 месте ?

Поисковая система Вам ничего не должна. Хотя у нее есть желание дать пользователю релевантный ответ, и она эту задачу неплохо решает. По данному запросу топ достаточно релевантен, а 4-я страница яндексоидов не интересует. Какая разница, кто там выше? :)

sidor-r:
Они "работают" так же как и все остальные.

Как правило - да.

sidor-r:
P.S. Яндекс объявил нам(оптимизаторам) открытую войну!!!

У Вас паранойя. :D

seolink74:
Есть у меня сайтик который в sape трудится на мое благо. Страниц около 300.. ТИц около 200... в ЯК
По 4-м СЧ запросам в топ 10 Возраст сайта 4 года. На странице не более 2-х внешних.. на морде тоже 2 внешних..
Стоимость ссылки примерно 30 руб.

А есть и такие доноры: 4000 страниц/ТИЦ накачан в sape ГС донорами/по 3 внешних ссылки со страницы/продано около 60% мест ТИц 70 ПР главной 3 Сайту 2 года.

Вы хотите сказать что ссылки будут одинаково работать?

В общем случае ссылки будут по разному работать для разных акцепторов. Ваши, как вариант, могут вообще не работать для большинства покупателей. :)

bukvofil:
Может оптимизаторам нужно поучиться у науки?

Может Вам для начала нужно разобраться в теме, а потом уже вылезать из раздела копирайтинга? ;)

Inoff:
Под "разработками" я имел ввиду, например, банальное обрезание окончаний, не более. Просто хочется понять, насколько можно верить сервису.

А, Вы о стеммерах... Конечно же нет, в Руках используется хороший морфологический анализатор (какой- пусть сами скажут). Другое дело, как он используется, я не проверял на хитрых текстах, ничего не могу сказать.

Inoff:
Запрос "общество" информационный, а значит нельзя его брать на эталон. Мало того, что информационные запросы могут ранжироваться по другому, чем транзакционные, так еще и уровень конкуренции отличается на порядки.

Я уже писал где-то, что логичнее выглядит другая гипотеза - после ранжирования накладывается фильтр, т.е. спамность режется независимо от релевантности, по конкретным запросам, возможно даже по конкретным (обработанным) документам.

Inoff:
А как у руках определяются морфологические формы? Что-то свое используется, или что-то заимствованное?

Вы думаете, что сеонисты сегодня готовы к разработкам собственных морфологических анализаторов? Вроде же ничто в отрасли на это не намекает, задача достаточно затратная и наверняка не окупаемая. Ну и уже есть два анализатора от Яндекса - более грубый, но быстрый mystem и более точный, но медленный АОТ. Все пользуются одним из, на мой взгляд мистема вполне достаточно.

yanus:
а тем кто надумает проводить "исследования" искренне совету вспомнить студенческие годы, когда "нудные" преподы требовали даже при проведении примитивных лабораторок писать цели эксперимента, теоритическую часть, подбор инструментария, минимизацию факторов, которые могут повлиять на эскперимент (кроме исследуемых факторов) , обоснование методик, создание контрольных групп или экспериментов и тд

Это при исследовании черных ящиков такой сложности? Да Вы, батенька, наивняк... ;)

Тот факт, что кто-то много спарсил и что-то посчитал - это всегда гуд, Wasya, продолжай в том же духе. Для мну в статье мало графиков - по каждому столбцу в диаграммах интересно было бы посмотреть на график распределения. Еще более интересно было бы сделать несколько пересчетов, привязать такие графики к конкретным апам и посмотреть динамику. Может и родилась бы какая-то безумная идея. :)

Всего: 1960