«Обнинск» — новое ранжирование для гео-независимых запросов в России

G00DMAN
На сайте с 19.04.2008
Offline
122
#81

sealord, я wolf-а немного о другом спрашивал. Меня в данном случае интересует не ранжирование тульских в Туле, а ранжирование не тульских из разных ветвей классификатора.

Илья Зябрев, AlterTrader Research Ltd. Последние статьи: Об отмене ссылок в Яндексе. (www.altertrader.com/publications38.html)|Поведенческие факторы (формулы) (www.altertrader.com/publications36.html) Жадные алгоритмы Яндекса. (www.altertrader.com/publications20.html)|MatrixNet для «чайников». (www.altertrader.com/publications19.html)
wolf
На сайте с 13.03.2001
Offline
1183
#82
G00DMAN:
А с чего ты решил, что разные формулы? Почему тебя не устраивает вариант с одной формулой, но с ветвлением по этому фактору на 3 ветки? А то ведь так можно и любую кусочно постоянную функцию обозвать "много формул". Или есть еще какие-то соображения?

Скажем так, исходя из многочисленных наблюдений и экспериментов. Есть твердая уверенность, что это именно разные формулы.

Ветвление же факторов (региональных) происходит уже внутри этих формул. Вернее, просто они имеют различное значение. Поэтому построенные на общероссийской формуле выдачи, скажем для Тулы и Орла - различны. Так вот, различия внутри формул (т.е. между теми же Тулой и Орлом) намного меньшие, чем между формулами (т.е. между Тулой и, скажем, Екатеринбургом). Это хорошо видно на тестовых коллекциях, где различия региональных факторов устремлены к нулю.

G00DMAN:
Кстати - мне показалось, что промежуточные (родительские) регионы уже не рулят, и близость с регионом по родителю ниже уровня "Россия" ничего не дает. Т.е. например в Туле московские сайты (близкие по региону "Центр") и питерские (которые гораздо дальше) ранжируются одинаково. Можешь подтвердить такое наблюдение, или я ошибся?
Могу. Близость регионов либо не играет роли, либо имеет совсем мизерное влияние
G00DMAN:
Я бегло посмотрел - на самом деле похоже на то, что не Москва отдельно, а весь куст дерева, начиная от "Москва и область". Т.е. туда же и Одинцово, и Мытищи, и прочие. Видимо с остальными такая же фигня, весь всписок регионов разбит на слегка бОльшие кучки.

Да, скорее всего, именно так.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
sealord
На сайте с 03.10.2003
Offline
128
#83
G00DMAN:
sealord, я wolf-а немного о другом спрашивал. Меня в данном случае интересует не ранжирование тульских в Туле, а ранжирование не тульских из разных ветвей классификатора.

Могу сказать, что московских большинство, но близость тут или их общее большое количество в любой тематике играет роль - хз. А вот в том же туризме Екатеринбурга больше чем Питера в тульской выдаче. Врятли сильно влияет.

Ora et labora
S
На сайте с 27.04.2010
Offline
13
#84
gtauter:
У меня сегодня более-менее выстроилась выдача. Но с ГЗ все та же ерунда. Ждем-с.

Аналогично. По ГЗ запросам в топе ни одного ивановского сайта. Жесть!

G00DMAN
На сайте с 19.04.2008
Offline
122
#85
wolf:
Скажем так, исходя из многочисленных наблюдений и экспериментов. Есть твердая уверенность, что это именно разные формулы.

Я твоих цифр не видел, потому пока буду считать, что формула все же одна. Хотя это вроде в данном случае не сильно принципиально, т.к. мы в итоге получаем одну и ту же конфету (релевантность) в немного разных обертках. Сильное отличие в подходах одна/много может быть только в случае, когда дробление на интервалы по некоторым факторам существенно различны. Если ты такое смог четко доказать, то гуд.

Я просто исхожу из собственного многолетнего опыта решения подобных задач (иногда более сложных, чем матрикснет) в других областях математики. И придерживаюсь мнения, что большая обучающая выборка - хорошо, а меньшая - хуже. Поэтому деление оцененного асессорами на несколько меньших кучек - это как серпом по боллзам. :)

Что касается разбиения множества регионов всего на 3 кучки, то возможно это от мощности асессоров зависит, больше кучек им пока не осилить.

wolf:
Ветвление же факторов (региональных) происходит уже внутри этих формул. Вернее, просто они имеют различное значение. Поэтому построенные на общероссийской формуле выдачи, скажем для Тулы и Орла - различны. Так вот, различия внутри формул (т.е. между теми же Тулой и Орлом) намного меньшие, чем между формулами (т.е. между Тулой и, скажем, Екатеринбургом). Это хорошо видно на тестовых коллекциях, где различия региональных факторов устремлены к нулю.

Я посмотрел только относительное ранжирование "неместных" в этих кучках регионов на небольшой выборке от балды - оно вроде идентично. Или все же иногда это не так и что-то дергается?

A
На сайте с 04.07.2004
Offline
180
#86
orphelin:
походу было random($query);

Зато в новой версии (280 MB) просто перечислены все ГНЗ и топ10 для них прописан, а далее random($query); :))))

Выгодная партнерка по гороскопам (http://www.astroworld.ru/epp.htm) - предоставляем качественные сервисы. Хороший конверт, автоматические выплаты, постоянные клиенты.
wolf
На сайте с 13.03.2001
Offline
1183
#87
G00DMAN:
Я посмотрел только относительное ранжирование "неместных" в этих кучках регионов на небольшой выборке от балды - оно вроде идентично. Или все же иногда это не так и что-то дергается?

Именно так. Только "от балды" это не так просто поймать.

wolf
На сайте с 13.03.2001
Offline
1183
#88

Кстати, исходя из слов Расковалова

Первыми пользователями нового ранжирования стали украинский (август) и белорусский (сентябрь) поиски. Российской же версии (которая, собственно, и есть «Обнинск») потребовалась дополнительная оптимизация

можно предположить, что на основе общероссийской формулы также базируются украинская и белорусская выдачи. Только там отличия от российских регионов общероссийской формулы будут, естественно большие, чем между российскими регионами, т.к. региональные факторы отличаются не только на уровне регионов, но и стран. И вполне возможно, что есть еще и отдельные факторы, отвечающие за, так сказать, "украинскость" и "белорусскость".

G00DMAN
На сайте с 19.04.2008
Offline
122
#89

С поиском на украинском наверняка есть сложности, т.к. во времена незалежности в обиход ввели немеряно новых слов, которые усвоили и употребляют в документах далеко не все. Потому в частотных базах будут перекосы, явно влияющие на ранжирование.

Любопытно то, что работают только конечные регионы, промежуточные (родительские) влияют слабо или никак.

G00DMAN добавил 16.09.2010 в 16:15

Сергей, а у тебя случайно не сложилось мнения, когда начались первые эксперименты по геонезависимом у нас, на реальной выдаче? В середине августа что-то уже могло считаться по новому?

KKTS
На сайте с 17.11.2009
Offline
123
#90

Странный какой-то алгоритм: по запросу строительство магазинов на первом месте сайт о строительных магазинах, а мой сайт, именно о строительстве магазинов, на втором....

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий