- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Маркетинг для шоколадной фабрики. На 34% выше средний чек
Через устранение узких мест
Оксана Мамчуева
Seventh Son, Видимо проблемы все-таки остаются, несмотря на то, что с тех пор прошло больше 3-х лет. Иначе как объяснить, что при приеме сайта в ЯК тиц частенько меняется радикальным образом, причем в обе стороны? Да и скрытая часть каталога должна бы за это время стать весьма мощной, если работает автомат. Цифр нет, но, навскидку, даже для сайтов в топе по своим тематикам большинство - без указания раздела.
Есть две разных задачи, их не надо путать
* видимая пользователем (пусть даже через тулбар) классификация
* классификация для внутренних целей (тематичность ссылок)
Во второй задаче интересна полнота, а ошибки для 1% сайтов не имеют большого значения.
А в первой задаче интересна точность.
* классификация для внутренних целей (тематичность ссылок)
... интересна полнота, а ошибки для 1% сайтов не имеют большого значения.
В современных условиях эта задача не может быть решена в принципе. Интернет стал глобальной социальной средой, и траффикообразующие ссылки, по которым люди без принуждения переходят на другие сайты, выставляются на ресурсах с размытой (универсальной) тематикой. Но от этого они не становятся менее тематичными, менее качественными. Учесть последнее поисковым системам нынешнего поколения не под силу, т.к. большинство таких ссылок не имет "человекоподобного" анкора. Анализировать текст всей страницы, как это делал бы человек, поисковикам пока не под силу.
В современных условиях эта задача не может быть решена в принципе. Интернет стал глобальной социальной средой, и траффикообразующие ссылки, по которым люди без принуждения переходят на другие сайты, выставляются на ресурсах с размытой (универсальной) тематикой.
Полностью согласен - slashdot effect сейчас очень сильно работает.
Но от этого они не становятся менее тематичными, менее качественными. Учесть последнее поисковым системам нынешнего поколения не под силу, т.к. большинство таких ссылок не имет "человекоподобного" анкора. Анализировать текст всей страницы, как это делал бы человек, поисковикам пока не под силу.
В каком смысле "не под силу" ? Контекстная реклама на страницы ставится вполне точно. Я бы сказал, что точность определения тематики - процентов 70-95 (вот такие вот широкие ворота), это при том, что нужно определять тематику двух текстов: объявления и страницы на котором оно размещается. Чтобы получить 81% произведения, нужно по каждому из текстов (объявления и страницы) сработать на уровне 0.9. Точность 0.8 дает и Автоконтекст (на русских текстах) и AdSense (на английских). Директ не меряли пока.
У нас на Новотеке полнота определения тематики новостей около 0.9, а точность до такой степени высокая, что не стыдно людям показывать новости в классификаторе. Т.е. я грубых ошибок просто не вижу, а мелочи - они и есть мелочи.
К задаче определения темы примыкает вторая - из страницы нужно выделить содержание (убрать анонсы других материалов и так далее). Задача тоже кажется вполне решаемой, прототип у нас работает :)
Задачи вроде автореферирования одного текста или дайджеста группы текстов - тоже решенные с вполне приличным качеством.
Да, я нигде не говорю, что компьютер "научился понимать смысл". Т.е. по статье про Apple IPhone он не сможет заключить рулит игрушка или сосет. Но вот рубрику "Электроника - Мобильные Телефоны" присвоить - несложная задача.
Ну как это нет ? На многотематическом сайте на новых URL-ах тематическая реклама показывается и она "в тему".
Да и вообще, не бог весть какая наука. У нас такая машинка есть, не вижу причин не сделать ее и Яндексу. Там нет ничего принципиально сложного, а они точно этим занимались еще года два назад.
Вы безбожно путаете Я.Директи Я.Каталог это два сервиса не взаимосвязанных, так же как описк и ЯК не связаны. Это разные звенья одной цепи.
Вы безбожно путаете Я.Директи Я.Каталог это два сервиса не взаимосвязанных, так же как описк и ЯК не связаны. Это разные звенья одной цепи.
Повторяю то, что написал несколько выше: "если бы я рулил Яндексом", я бы конечно использовал автоматический определятор тематик при анализе ссылочного ранжирования.
А происходит оно сейчас или нет - мне неведомо.
я бы конечно использовал автоматический определятор тематик при анализе ссылочного ранжирования.
-определение тематичности ссылок для расчета тиц и
-определение тематики для показа контексной рекламы
две разные задачи.
(Кстати, насколько я знаю, тематику сайта, где гоняется ЯД, смотрят опять же модераторы!)
Первая задача существенно сложнее и ответственней, т.к. требуется привязка к разделам ЯК (которые так или иначе, достаточно субьективны), и результаты используются для ранжирования в ЯК.
В этом топике изначально обсуждалась первая задача (тематика для тиц-а), в то время как встречные аргументы звучат, почему то, по второй.
Теоретическая и практическая проработка вопросов также обычно сильно отличается.
А происходит оно сейчас или нет - мне неведомо.
Именно практическое использование автоматического распознавания тематики с привязкой к ЯК при расчете тиц и вызывает большие сомнения. Аргументы приводил ранее.
Наверное сразу стоит разделить понятия "тематика сайта" и "тематика страницы". Для страницы автоматом определяется более-менее сносно (почти вся реклама), а вот для сайта это сделать автоматом очень сложно, поэтому только модератор (ЯК как пример)
Dybra, верно, я то про тематику сайта (тиц)...
Наверное сразу стоит разделить понятия "тематика сайта" и "тематика страницы". Для страницы автоматом определяется более-менее сносно (почти вся реклама), а вот для сайта это сделать автоматом очень сложно, поэтому только модератор (ЯК как пример)
А почему сложно ? Считаем средние частоты тематик (постраничные). Если что-то
вылезло - это и есть тематика сайта. И только если не вылезло, потребуется
вмешательство модератора.
А почему сложно ? Считаем средние частоты тематик (постраничные). Если что-то
вылезло - это и есть тематика сайта. И только если не вылезло, потребуется
вмешательство модератора.
Сложность (как это не пародоксально) в определении самого термина "Тематика". Вопрос каждый месяц поднимается на форуме, но воз и ныне там. Дайте определение этого термина и поймете всю сложность. Плюс большую ложку дёгтя тут вносят разносторонние сайты, где тематика уже может делиться в каком-то отношении: допустим сайт 40% "авто", 30% "путешествия", 20% "техника" а остальное вообще не поймешь о чем, даже человеку сложно понять о чем это. Куда девать и относить такие сайты? Поэтому пока другого решения кроме ЯК я лично не вижу. Они определяют категории тематик (очень условно) и они же пытаются под эти условности "натянуть" Рунет.