- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы
Для интернет-магазина инженерных систем
Мария Лосева
Это напоминает ваши давние слова. Что дальше?
Как - что? Работать с сайтом :)
Проблема в том, что подобрать нужные документы является более сложной задачей, чем составить анкоры. Решение этой проблемы очень затратное и тематический классификатор наподобие созданного руками не поможет. Задача много сложнее, поскольку "тематичность" документа в понимании Яндекса, это МНОЖЕСТВО из ключевых слов, а не пассаж.
Я сейчас наверное глупость какую-то скажу, но что, Яндекс как-то определяет "тематичность" (ну наверное уместно говорить тематику) документа? Я видимо сильно отстал по этой части, где бы про это почитать.
Взлетевший до небес пользователь, и сильно шлепнувшийся потом об стог сена с вилами уже не раз слышал оговорки о его "дерьме".
К сожалению, сие "дерьмо" имеет вполне реальное воплощение в конкретных числах значений многих факторов текущего алгоритма. Я подозреваю, что не всегда эти числа определяются корректно, но их наличие это есть медицинский факт, не зависящий от того, верят ли в него сеошники или нет.
Я видимо сильно отстал по этой части, где бы про это почитать.
Сам спросил и сам ответил - хороший топик старой закалки 2006 года :)
Из которого видно, что Вольф уже тогда верил в тематику документа, а Rаширин - не верил. :D А я и сейчас не верю.
нет, он всегда говорил, что это бред
Скорее, по логике должна быть некая функция от частоты встречаемости слова в документе и его веса по общей коллекции документов. И тоже самое для пар, троек и т.д. слов. Те, что пройдут некий "кворум" и будут индикаторами тематики.
По-моему Сергей вовсе не говорит, что это бред, ты топик-то тот почитай :)
Специально для неорганизованного подполья в лице г-на тара и его альтерэг.
1) Эффектор работает с тематикой доноров чуть ли не с момента открытия. Причем если вначале дело ограничивалось выборкой по тематикам/рубрикам ЯК + сейпа, то сейчас мы определяем тематику любой страницы с точностью, доступной разве что поисковым системам.
Вот "секретный" урл, где лежит демо-версия алгоритма определения тематики:
http://we-planer.mirahost.ru/
Рубрики читать справа-налево, про веса и алгоритм взвешивания пока ничего не скажу - просто знайте, что в нем используется очень большое количество неравнозначных факторов.
Демка работает медленно, специально выложил на виртуальный сервер, чтобы успели поиграться.
Завтра-послезавтра урл закрою.
И да - тематика доноров уже давно имеет влияние на ссылочную релевантность и скорее всего это влияние будет расти.
2) Про пользовательские факторы мы знали очень давно, практически с момента их введения. Разница между нам в том, что вместо публичного пустозвонства на форумах мы работали над пониманием этих факторов, учились определять ситуации когда именно пользовательские факторы не дают сайту выйти в топ, разрабатывали рекомендации для клиентов по улучшению сайтов.
К примеру, очень скоро мы дадим определенной группе пользователей Эффектора функционал, позволяющий определить проблемные запросы с точки зрения пользовательских факторов, а чуть позже внедрим обновленные рекомендации, позволяющие действительно решить эти проблемы.
В ваших словах есть здравые мысли, но еще больше чуши и шаманства. Сделайте реальное исследование, подкрепленное математическими выкладками и однозначными экспериментами. Тогда и будем обсуждать, а пока - Сергей абсолютно прав, игнорируя ваши реплики :)
Вот "секретный" урл, где лежит демо-версия алгоритма определения тематики:
http://we-planer.mirahost.ru/
Ввёл один урл - вообще тематика не определилась, ввёл другой - 31 тематика. Скрипт вообще работает?
И да - тематика доноров уже давно имеет влияние на ссылочную релевантность и скорее всего это влияние будет расти.
Так донора в целом? Или документа? :)
Ввёл один урл - вообще тематика не определилась, ввёл другой - 31 тематика. Скрипт вообще работает?
Ну как бы без примера не будет ответа, да. Если вы пытались ввести что-то типа лента.ру, то скорее всего и не определится (хотя у той же ленты скрипт определяет новости :) )
По поводу 31 тематики - а вы веса смотрите. Из 31 2-3 будут иметь высокий вес, остальные - маленький, который можно списать на погрешность.
Так донора в целом? Или документа?
Ох уж эти неоднозначности. По контексту надо смотреть, в данном контексте донор = страница = документ.
Так донора в целом? Или документа?
Более логично, что донора. Определяется скажем так: объединяются слова сайта, удаляются дубли и стоп-слова, те что остаются - смотрится число повторяемости на разных страницах. Те что повторяются свыше определённого % от числа страниц, выделяются в отдельную группу и сверяются с шаблонами на схожесть модели, затем присваивается коэффициент принадлежностей тематикам. Понятно, что немного посложнее чем я написал, есть ещё дополнительные сита и исключения.