G00DMAN

G00DMAN
Рейтинг
122
Регистрация
19.04.2008
zZmeIOka:
G00DMAN, еще может быть вариант, что "бочка дубовая" - некоммерческий запрос, обсчитываемый другим алгоритмом ;)

Не, смысла в другом алгоритме никакого вроде нет.

NovaPS:
Скорее 2-й вариант (но в следующих корректировках он уже может быть причислен к пессимизируемым).
1-й отпадает, т.к. есть страницы, где плотность для "бочка дубовая" раза в 2 превосходит, чем для основного "бочки дубовые" и в выдаче он себя прекрасно чувствует.
А 3-й невозможен в силу того, что есть документы, для которых один переспамленный ВК/ВЧ запрос (в пределах одной и той же страницы конечно) уже опустили, а другой ВК/ВЧ - нет. Но это, чисто ИМХО :)

1-й не отпадает, т.к. формулу переспама пока даже примерно никто не определил. 3-й тоже возможен - сайты выкидывают из топов группками, не все сразу.

devzev:
Читайте "Мадридский доклад" и поймёте, что и ему найдётся место в иерархии.

Да не факт, что его опять включили, скорее нет.

boga@voxnet.ru:
Я пока ничего менять не собираюсь. Нелогично такое ранжирование само по себе. Ну не может быть, чтобы запросам "бочки дубовые" и "дубовые обочки" были релевантны 2 разные страницы.:) Причем ода из них накачанная морда, другая внутряк....

Почему не логично? Все логично и об этом уже много писалось в ветке.

Что касается того, что "бочки дубовые" улетели а "бочка дубовая" осталась в топе, то варианты например такие:

1. по "бочка дубовая" Вы не переспамили.

2. переспамили, но этот запрос не будет обсчитываться для пессимизации.

3. переспамили, но Вашу страницу пока не обсчитывали, все еще впереди. :D

CredoLol:
G00DMAN, а что сейчас вместо IDF использует ПС? Или же вообще игнорирует эту некогда широко обсуждаемую запчасть некогда актуальной «формулы ранжирования»?

Яндекс использовал ICF, копал в сторону DFR, может и предложенные нами меры уже пробовал. Западные поисковики в рунете используют подход, основанный на BM-25 и IDF. Я надеюсь, что частотные подходы к поиску и ранжированию со временем отойдут на второй план, в разряд вспомогательных. :)

CredoLol:
Господа, извините, что вмешиваюсь. Вы говорите о различии понятий «точное вхождение» и «плотность ключа» в анкор-листе, верно? То есть в этих ваших постах речь идет об некой условно отмеченной тенденции увеличения плотности ключа в анкор-листах при уменьшении количества точных вхождений? Извините, если я чего-то недопонял.

Никто не говорил об увеличении плотности в среднем по больнице. :)

Psycho:
А тебе давали взглянуть на "внутренности" и алгоритмы Пульта?

А зачем? Внутренности пульта - это таблица каскадов фильтров. Изначально мне подход не очень нравился, но Миха и ко его развивают, может и будет из этого толк. Они, как мне кажется, дальше всех ушли в таких исследованиях, благо есть богатая стата. В том, куда они копают было бы интересно поковырять, дык кто ж даст. :)

Если ты не в курсе, в Сеопульте есть ручные режимы, по типу сценариев Рук, только более навороченные.

Psycho:
И как, получалось "Пультом" в топ-1 загнать? :) (а там есть работа на топ-1?)

Я прикалывался с Сеопультом ради интереса больше года назад. Не получилось. :)

IndexSa:
Считаете только по запросу, а не целиком?

Ну да. В топике достаточно потерпевших только по ряду запросов. :)

intraweb:
G00DMAN, если Вам не сложно, можете пример показать где выросла плотность в анкорлисте? Или хотя бы количество точных вхождений?

Сложно, поверьте на слово.

Про количество вхождений я, кстати, ничего не говорил. :)

CredoLol:
Что, кроме новой «нормировки» tf появилась и новая «нормировка» idf? Я полагал, что idf всегда «плавала» совершенно незначительно (от изменения корпуса документов в числителе и количество документов в знаменателе) - так как корпус огромен и предполагая, что резкого изменения его не происходит (возможно, за исключением обострения АГС-ов) и прирост корпуса (или его уменьшение) условно в находится пропорции (сопоставим) с приростом знаменателя от апдейта к апдейту, то изменением idf на коротких промежутках времени вообще можно пренебречь. Безусловно хотелось бы здесь считать idf константой, хоть условно, иначе вообще запутаться можно. Или Вы настаиваете совсем не упускать из виду idf? Тогда что Вы этим хотите сказать? idf считается не по всему корпусу, а в привязке к региону и значительно влияет на то, что мы сейчас обсуждаем в этой ветке форума? Или же idf считается как-то иначе?

IDF не принято считать по всему индексу, она считается по некоторой большой коллекции документов. Это не динамический фактор, меняется очень редко. Строить коллекции документов по региону врядли имеет смысл. Ну и собственно IDF не используется вроде бы достаточно давно в Яндексе, что подтверждается тестами. :)

devzev:
Да, средняя плотность по ТОПам стала на порядок ниже.

На порядок? Как бы не так. Где-то плотность ключа даже возросла. :D

CredoLol:
Да, не вкурил, затем и здесь🚬. Я приводил примеры перескока с внутряка на внутряк, причем, в некоторых моих случаях, почти без потери позиций - про морды это не я, Вы меня с кем-то спутали. Хорошо,- «переспамил» (условно) документ (не обязательно морду) - получи минус - это понятно и доходчиво, а вот зачем в выдачу давать другой документ этого же сайта (который «условно переспамлен» уже по другому ключу) - неясно и невкурительно. Не поможете вкурить эту логику? А то здесь очень много мечущихся в напрасных стенаниях бандерлогов, в числе которых и я - Ваш покорный слуга. Много не надо - только логику.

Вы немного не поняли. У Вашего сайта может быть несколько страниц с достаточно высокой релевантностью запросу (по текущей формуле ранжирования). Если продвигаемая страница пессимизирована по запросу, то ее релевантность становится ниже и с сайта может браться другая страница, которая оказалась выше по релевантности. Если из топа улетело много страниц, то Ваша другая страница в теории может стать в выдаче даже выше, чем стояла продвигаемая. :)

Мы тут немного подумали в своем коллективе о возможностях "когнитивного" анализа и сделали некоторые выводы.

Самая главная особенность синтаксического анализатора - это возможность уйти от частотных оценок (IDF/ICF и им подобных) релевантности содержания документа относительно запроса к метрикам, которые позволят анализировать структуру документа с точки зрения ее синтаксиса, что по идее может повысить качество текстового ранжирования. Теперь можно анализировать документ не частотными метриками, а разбирая его структуру, чтобы определить о чем этот документ, т.е. проводить смысловой или содержательный анализ. Ведь частотный анализ - это тупо анализ состава, а синтаксический анализ - это уже анализ структуры.

По многословникам можно много чего интересного придумать. Возможна корректная работа с омонимами. И с таким подходом по запросу А5 уже не вылезет ... :)

Меня сегодня залогинили в Руки с просьбой что-то сказать по поводу. А то слишком я в теме нафлудил. :)

Psycho:
Плюсы системы, на мой взгляд: по сравнению с "предыдущим поколением" система гораздо легче и удобней, гораздо продуманней интерфейс (тут руку приложил leonid.ws) и более понятна схема работы.

Возможно Руки и легче реактора, но не сильно продвинутее Сеопульта. Про Вебэффектор ничего не могу сказать, внутри не смотрел.

Psycho:
Лично моё внимание привлекла заложенная в систему модель "сценариев", которые по сути представляют собой комбинации фильтров для покупки ссылок (подобно тем, что используются многими в Sape, только более "интеллектуальными").

"Модель сценариев" - это просто каскад фильтров по типу саповских, примерно того же уровня, по количеству параметров, но не по качеству. В отличие от Сапы, тИЦ и цену можно ввести не любые, есть только выбор из ограниченного меню. По тИЦ - 0,10,100,250,500,1000,2500,5000,>5000. По "цена до" есть кусок 10,50,100,250,500,1000,2500. Т.е. можно купить только так и никак иначе. Видимо так покупает Ингейт. В чем большая "интеллектуальность" урезанных сапа-фильтров - не понял ни разу.

Psycho:
У пользователя есть возможность как использовать систему сценариев, заложенную "внутрь" по дефолту, так и использовать свои варианты. То есть система является не "чёрным ящиком", в который закладываешь деньги в надежде получить на выходе результат в виде топа (подобно Вебэффектору или же Сеопульту), а действительно "руками", с помощью которых достаточно удобно работать со ссылочным как новичку, так и профессионалу.

Про Вебэффектор ничего не могу сказать, но в Сеопульте "систему сценариев" можно настроить гораздо тоньше, т.к. там, кроме "ручных" параметров есть еще:

"прогноз до" по количеству ВС (как и в Сапе)

"продается дней"

"ключевые слова" на доноре (как и в Сапе)

возраст домена (как и в Сапе)

стоп-слова в URL

стоп-слова в title

минимальный объем контента донора.

Я завел один проект, один ключ. При добавлении ключа подозрительно тормозило, вспомнился Реактор.

При составлении сценария для прикола Руки сообщили, что по фильтру тИЦ >100, 3УВ, до 2 ВС, ЯК, цена до 100р ссылок в системе нет. Видимо старые уже все разобрали, а новых пока не завезли. :D

На странице хелпа по составлению текстов ссылок приведен пример проекта для Ксапы, типа юмор такой? :)

В хелпах не нашел ничего о стоимости сервиса для оптимизатора, не понятны комиссии при вводе бабла и при покупке ссылок.

Вроде все пока что. :)

G00DMAN добавил 03.02.2010 в 02:21

А, вот еще забыл. В Руках можно поставить целью выйти в топ 3, 5 или 10. Хотя для многих НЧ важен только топ-1. Ну и не только для НЧ, например бдбд.ру нужен топ-1 по ВЧ, точно не отдадут в чужие руки. :D

zZmeIOka:
да кстати, могу предложить элегантный выход тем, у кого запросы со страниц посваливались.

Для начала определяете список релевантных запросу страниц на вашем сайте. На всех страницах, более релевантных, чем главная, убираете ключ из тайтла (должно хватить) и h1-h6-bold (контрольный). Все будет пучком ;)

Это не выход. :)

Провалились из-за пессимизации, т.е. текущее значение релевантности опущенной страницы запросу ниже, чем релевантность той, что попала в выдачу. Если понизить релевантность и на других страницах - улетите вообще в никуда.

zZmeIOka:
кстати еще забыл сказать, очень рекомендую ознакомиться со страницами на вашем же сайте, которые более релевантны запросу, нежели продвигаемая. Скабрезное зрелище, надо сказать 🤪

Более релевантны при поиске по сайту? Ну так там ранжирование несколько отличается от ранжирования в общей выдаче. :)

Всего: 1960