Webeffector - бодро продвигаем сайты автоматом. Не шашечки, но ехать.

wolf
На сайте с 13.03.2001
Offline
1183
#1561
богоносец:
Это напоминает ваши давние слова. Что дальше?

Как - что? Работать с сайтом :)

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
Таггу x_x
На сайте с 31.10.2005
Offline
445
#1562
монаяскаву:
Проблема в том, что подобрать нужные документы является более сложной задачей, чем составить анкоры. Решение этой проблемы очень затратное и тематический классификатор наподобие созданного руками не поможет. Задача много сложнее, поскольку "тематичность" документа в понимании Яндекса, это МНОЖЕСТВО из ключевых слов, а не пассаж.

Я сейчас наверное глупость какую-то скажу, но что, Яндекс как-то определяет "тематичность" (ну наверное уместно говорить тематику) документа? Я видимо сильно отстал по этой части, где бы про это почитать.

☠️☠️☠️
wolf
На сайте с 13.03.2001
Offline
1183
#1563
Pokerist:
Взлетевший до небес пользователь, и сильно шлепнувшийся потом об стог сена с вилами уже не раз слышал оговорки о его "дерьме".

К сожалению, сие "дерьмо" имеет вполне реальное воплощение в конкретных числах значений многих факторов текущего алгоритма. Я подозреваю, что не всегда эти числа определяются корректно, но их наличие это есть медицинский факт, не зависящий от того, верят ли в него сеошники или нет.

Таггу x_x
На сайте с 31.10.2005
Offline
445
#1564
Tarry:
Я видимо сильно отстал по этой части, где бы про это почитать.

Сам спросил и сам ответил - хороший топик старой закалки 2006 года :)

Из которого видно, что Вольф уже тогда верил в тематику документа, а Rаширин - не верил. :D А я и сейчас не верю.

Таггу x_x
На сайте с 31.10.2005
Offline
445
#1565
стереолиза:
нет, он всегда говорил, что это бред
wolf:
Скорее, по логике должна быть некая функция от частоты встречаемости слова в документе и его веса по общей коллекции документов. И тоже самое для пар, троек и т.д. слов. Те, что пройдут некий "кворум" и будут индикаторами тематики.

По-моему Сергей вовсе не говорит, что это бред, ты топик-то тот почитай :)

MiRaj
На сайте с 03.07.2006
Offline
509
#1566

Специально для неорганизованного подполья в лице г-на тара и его альтерэг.

1) Эффектор работает с тематикой доноров чуть ли не с момента открытия. Причем если вначале дело ограничивалось выборкой по тематикам/рубрикам ЯК + сейпа, то сейчас мы определяем тематику любой страницы с точностью, доступной разве что поисковым системам.

Вот "секретный" урл, где лежит демо-версия алгоритма определения тематики:

http://we-planer.mirahost.ru/

Рубрики читать справа-налево, про веса и алгоритм взвешивания пока ничего не скажу - просто знайте, что в нем используется очень большое количество неравнозначных факторов.

Демка работает медленно, специально выложил на виртуальный сервер, чтобы успели поиграться.

Завтра-послезавтра урл закрою.

И да - тематика доноров уже давно имеет влияние на ссылочную релевантность и скорее всего это влияние будет расти.

2) Про пользовательские факторы мы знали очень давно, практически с момента их введения. Разница между нам в том, что вместо публичного пустозвонства на форумах мы работали над пониманием этих факторов, учились определять ситуации когда именно пользовательские факторы не дают сайту выйти в топ, разрабатывали рекомендации для клиентов по улучшению сайтов.

К примеру, очень скоро мы дадим определенной группе пользователей Эффектора функционал, позволяющий определить проблемные запросы с точки зрения пользовательских факторов, а чуть позже внедрим обновленные рекомендации, позволяющие действительно решить эти проблемы.

В ваших словах есть здравые мысли, но еще больше чуши и шаманства. Сделайте реальное исследование, подкрепленное математическими выкладками и однозначными экспериментами. Тогда и будем обсуждать, а пока - Сергей абсолютно прав, игнорируя ваши реплики :)

Муркетолог. 100 пресс-релизов с прямыми ссылками за 150 баксов? Легко! (http://b2blogger.com) Статейный маркетинг - лучшее лекарство от Минусинска! (http://miralinks.ru)
S2
На сайте с 07.01.2008
Offline
611
#1567
MiRaj:
Вот "секретный" урл, где лежит демо-версия алгоритма определения тематики:
http://we-planer.mirahost.ru/

Ввёл один урл - вообще тематика не определилась, ввёл другой - 31 тематика. Скрипт вообще работает?

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
Таггу x_x
На сайте с 31.10.2005
Offline
445
#1568
MiRaj:
И да - тематика доноров уже давно имеет влияние на ссылочную релевантность и скорее всего это влияние будет расти.

Так донора в целом? Или документа? :)

MiRaj
На сайте с 03.07.2006
Offline
509
#1569
Str256:
Ввёл один урл - вообще тематика не определилась, ввёл другой - 31 тематика. Скрипт вообще работает?

Ну как бы без примера не будет ответа, да. Если вы пытались ввести что-то типа лента.ру, то скорее всего и не определится (хотя у той же ленты скрипт определяет новости :) )

По поводу 31 тематики - а вы веса смотрите. Из 31 2-3 будут иметь высокий вес, остальные - маленький, который можно списать на погрешность.

Tarry:
Так донора в целом? Или документа?

Ох уж эти неоднозначности. По контексту надо смотреть, в данном контексте донор = страница = документ.

S2
На сайте с 07.01.2008
Offline
611
#1570
Tarry:
Так донора в целом? Или документа?

Более логично, что донора. Определяется скажем так: объединяются слова сайта, удаляются дубли и стоп-слова, те что остаются - смотрится число повторяемости на разных страницах. Те что повторяются свыше определённого % от числа страниц, выделяются в отдельную группу и сверяются с шаблонами на схожесть модели, затем присваивается коэффициент принадлежностей тематикам. Понятно, что немного посложнее чем я написал, есть ещё дополнительные сита и исключения.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий