Используйте слова из оглавления лестниицы для текста на странице - Общие вопросы оптимизации

Тематика документа

pro-maker · 2020-07-28T15:09:55.0000000Z

Яндекс путем автоматического анализа содержимого документа ставит ему в соответствие один из разделов Яндекс.Каталога. Это гипотеза. Основана она на описании одного из элементов аддитивной модели релевантности, используемой Яндексом на дорожках РОМИП-2006, и на косвенных подтверждениях существования аналогичного механизма в поиске непосредственно Сашей Садовским на конференции-2006 ( за что ему большое спасибо! ). Я.Каталог представляет собой фасетную матрицу. Для оценки тематической близости интересна иерархия ветвей лексики рубрикатора. Предположительно, общие термины закреплены за начальными разделами, более частные (специализированные) - за вложенными разделами. Например, "веб-дизайн", по всей видимости, относится к "Каталог / Hi-Tech / Интернет / Создание сайтов / Web-дизайн". Можно ли изложенное анализировать самостоятельно? Один из вариантов. Войти в "Я.Директ / Дать объявление /", внести одно слово в "ключевые слова", посмотреть рекомендуемый раздел подсказки "рубрики каталога: выбрать". В частности, рекомендуются разделы для размещения рекламы по ключевикам: "дизайн сайтов": / Hi-Tech / Интернет / Создание сайтов / Web-дизайн / "дизайн": / Hi-Tech / Интернет / Создание сайтов / Web-дизайн / "разработка сайтов": / Hi-Tech / Интернет / Создание сайтов / Web-дизайн / "продвижение сайтов": / Hi-Tech / Интернет / Создание сайтов / Web-дизайн / "поисковая оптимизация": / Hi-Tech / Интернет / Создание сайтов / Прочее / "оптимизация": [нет соответствий] "seo": / Hi-Tech / Интернет / Создание сайтов / Прочее / "спам": / Hi-Tech / Безопасность / Защита от спама / "пиво": / Дом / Кулинария / Пиво / "вино": / Дом / Кулинария / Алкогольные напитки / П.С. Спасибо Spark -у и Диме Пашко ("Ашманов и Партнеры") за помощь.

186

Dervish

24 ноября 2006, 17:03

#21

Каширин, кое-какие детали алгоритма вроде как описаны на сайте Яндекса

Пингвин под микроскопом. (http://ac-u.ru/arts/pingvin-pod-mikroskopom/) Особенности продвижения Интернет-магазинов. (http://ac-u.ru/arts/osobennosti-prodvizhenija-internet-magazinov-bytovojj-ili-kompjuternojj-tekhniki-s-interesnymi-primerami-i-zabavnymi-kartinkami/) Копирайтинг. Качественно. (/ru/forum/725909)

57

ХренРедькиНеСлаще

24 ноября 2006, 18:10

#22

psu:
прошу прощения, не совсем понял, как определить для фразы тематику понятно ("зайти в Я.Директ - Дать объявление - ..."), но если речь идет о странице (сайте), то как быть с ним? дергать пословно на соответствия тематики,а потом по какой-то схеме интрепретировать?

Вот тут можно почитать у Бойцова Леонида:

http://itman.narod.ru/

Благо, товарищ, вроде в Яндексе работал до ноября 2005 года и как раз по этой проблеме..

Дайте мне рюмку опоры и мир засветится всеми цветами радуги.

281

pro-maker

24 ноября 2006, 19:09

#23

ХренРедькиНеСлаще:
Вот тут можно почитать у Бойцова Леонида:
http://itman.narod.ru/

Хрнс, у itman-а о нечетком поиске. Похожесть, конечно, можно по-разному понимать, но тематическая близость, наверное, ближе к оценке пересечения с лексикой уровня рубрикатора. Не покажете конкретную ссылку, где у itman-а о тематической близости?

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

I

64

itman

24 ноября 2006, 19:47

#24

О тематической близости у Itman нет. Тематическая близость - это, все-таки, классификация. И к LSI: Latent Semantic Indexing

pro-maker:
Хрнс, у itman-а о нечетком поиске. Похожесть, конечно, можно по-разному понимать, но тематическая близость, наверное, ближе к оценке пересечения с лексикой уровня рубрикатора. Не покажете конкретную ссылку, где у itman-а о тематической близости?

Приходите завтра, завтра будет! (http://itman666.livejournal.com)

57

ХренРедькиНеСлаще

24 ноября 2006, 21:05

#25

pro-maker:
Хрнс, у itman-а о нечетком поиске. Похожесть, конечно, можно по-разному понимать, но тематическая близость, наверное, ближе к оценке пересечения с лексикой уровня рубрикатора

itman:
О тематической близости у Itman нет. Тематическая близость - это, все-таки, классификация

Возможно я неправильно выразился. Но мне лично при словах похожих "яндекс стал учитывать тематические ссылки" вначале на ум не классификатор приходит, а ПОХОЖЕСТЬ страниц донора и больного.

Кстати не вижу больших проблем введения классификатора, как расставляющего границы между похожими страницами, а вот для адекватного поиска похожих страниц проблем хоть отбавляй (это на мой взгляд).

Берем заданный документ, ищем похожие документы в Яндекс каталоге, упорядочиваем по "похожести", группируем по сайтам, и выдаем тематику первого в выдаче. Это если по топорному. Не по топорному тоже можно, если подумать

Например, по максимуму скалярного произведения на "тематические орты". Методов довольно много.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

I

64

itman

24 ноября 2006, 21:14

#26

Да нет, скорее всего, Яндекс на ходу классифицирует страничку, приписывая ее к нескольким категориям, а потом смотри, а есть ли среди этих категория пересечения. Если есть, то линки между страничками учитываются.

ХренРедькиНеСлаще:
...

Например, по максимуму скалярного произведения на "тематические орты". Методов довольно много.

345

pelvis

24 ноября 2006, 21:25

#27

Самый простой (и наверное правильный) вывод такой - использовать слова из оглавления лестниицы для текста на странице, я правильно понял Вас, Виталий?

ps: "Создание сайта" не показатель, точнее все равно не прокатит.

Продаю вывески. Задарма и задорого (https://www.ledsvetzavod.ru/)

281

pro-maker

24 ноября 2006, 21:32

#28

itman:
Тематическая близость - это, все-таки, классификация. И к LSI: Latent Semantic Indexing

itman, проблемы с русским, а с английским и совсем завал. :)

Смысловые индексы - это какие-то параметры, идентифицирующие набор смыслов слов документа, и соответствующий им (смыслам) иерархический рубрикатор?

pelvis, в качестве первого приближения. iГоша выше хорошо объяснил. :)

iГоша:
Ну да, сначала проверяем как автомат в директе определяет тематику по заданным ключевым словам, а потом делаем страницу с учетом полученного результата.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

I

64

itman

24 ноября 2006, 22:07

#29

LSI - это модный способ определения степени связности ключевых слов в количественном выражении. Это некоторый аналог корреляции терминов. Или степень синонимии. Используя эти данные, можно считать тематическую близость документов.

pro-maker:
itman, проблемы с русским, а с английским и совсем завал. :)

Смысловые индексы - это какие-то параметры, идентифицирующие набор смыслов слов документа, и соответствующий им (смыслам) иерархический рубрикатор?

pelvis, в качестве первого приближения. :) iГоша хорошо выразил. :)

281

pro-maker

24 ноября 2006, 22:17

#30

itman:
LSI - это модный способ определения степени связности ключевых слов в количественном выражении. Это некоторый аналог корреляции терминов. Или степень синонимии. Используя эти данные, можно считать тематическую близость документов.

А для оценки близости по типам лексики LSI также используется?

Вышел новый Яндекс Браузер с YandexGPT и YandexART

Переиграть и победить: как анализировать конкурентов для продвижения сайта

Тематика документа