- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Маркетинг для шоколадной фабрики. На 34% выше средний чек
Через устранение узких мест
Оксана Мамчуева
В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Вот такая перспектива намечается - прочитал я, что появляются тематические SE и у кого на сайте сплошной супермаркет - тому не попасть даже в десятую сотку результатов поиска. Выживут только узкотематики. И вроде бы АлтаВиста этим делом занимается. Короче не знаю - может что не так понял, но общий смысл ясен - технологии поиска меняются. Так это и есть мой вопрос - что такое тематические SE?
что такое тематические SE?</font>
Это SE, которые, кроме обычных методов вычисления релевантности, стараются выяснить тему сайта. Определяется она, как правило, на основании анализа частот слов в тексте и сравнения с заранее построенными (на основе "образцовых" документов) описаниями тематик.
В описании тематики используется, как правило, от 10 до 30 терминов. Чтобы выяснить, какие слова документов включать в описание, для каждого из них определяется значимость его для конкретной тематики, основанная на частоте встречаемости слова в данной теме (чем больше, тем лучше) и в других темах (чем меньше, тем лучше).
Документ может относиться к нескольким темам сразу, если в нем доминируют слова из описаний нескольких тематик.
Существуют методы классификации по темам на основе анализа ссылок из тематически однородной группы образцовых страниц (например, из раздела каталога), но гораздо качественней работают смешанные методы, использующие как текстовое содержимое, так и авторитетность в ссылках среди данной тематики (Hilltop, алгоритм тематической дистилляции Клейнберга и др.).
Результаты классификации могут отображаются пользователю, чтобы он мог сузить тематику поиска. Мне неизвестно, работает ли с темами сайтов Northern Light (в их Custom Folders), но алгоритм отображения категорий каталога Яндекса, похоже, использует не темы сайтов, а простой подсчет, сколько сайтов из результатов поиска, присутствующих в каталоге Яндекса, оказалось в той или иной категории.
Автоматическая классификация возможна также без предварительного описания тематик, лишь на основе статистистического профиля релеватных документов данной группы с исключением тех, кто не попадает в этот профиль. Но данный метод хотя и проще в реализации, больше подвержен шумам и не дает пользователю возможности сузить категорию поиска, поэтому он используется редко.
С точки зрения оптимизации сайтов необходимо, чтобы сайт был классифицирован должным образом. Если SE не использует информацию о ссылках, то в общем случае достаточно, чтобы самые распространенные слова нужной темы (и мало использующиеся в других темах) часто встречались в тексте страниц сайта.
С уважением,
Александр Садовский.
[This message has been edited by funsad (edited 17-11-2001).]
Добавлю, что, в основном, эту технологию использует Альтависта, о чем сильно шумели в прошлом году. Не думаю, что тебе сильно повредит это - идея состоит в том, чтобы уменьшить шум в результатах - убрать релевантные, но не тематические страницы. Правда, сомневаюсь, чтобы это работало более-менее надежно.
Правда, сомневаюсь, чтобы это работало более-менее надежно.</font>
Результат зависит от качества описаний тематик. Современные алгоритмы позволяют определить тему довольно качественно и надежно.
С уважением,
Александр Садовский.
Другими словами - если страница не вписывается в тему других страниц сайта - то ее лучше разместить на другом сервере чтобы не засорять тематику этого сайта. Так что ли?
Другими словами - если страница не вписывается в тему других страниц сайта - то ее лучше разместить на другом сервере чтобы не засорять тематику этого сайта. Так что ли?</font>
Одна страница, она не сыграет роли. Но если таких страниц наберется 10-20%, то действительно их лучше помещать отдельно.
С уважением,
Александр Садовский.