Попробуйте угадать с долей вероятности по общей коллекции документов - Общие вопросы оптимизации

Тематика документа

pro-maker · 2020-07-28T15:09:55.0000000Z

Яндекс путем автоматического анализа содержимого документа ставит ему в соответствие один из разделов Яндекс.Каталога. Это гипотеза. Основана она на описании одного из элементов аддитивной модели релевантности, используемой Яндексом на дорожках РОМИП-2006, и на косвенных подтверждениях существования аналогичного механизма в поиске непосредственно Сашей Садовским на конференции-2006 ( за что ему большое спасибо! ). Я.Каталог представляет собой фасетную матрицу. Для оценки тематической близости интересна иерархия ветвей лексики рубрикатора. Предположительно, общие термины закреплены за начальными разделами, более частные (специализированные) - за вложенными разделами. Например, "веб-дизайн", по всей видимости, относится к "Каталог / Hi-Tech / Интернет / Создание сайтов / Web-дизайн". Можно ли изложенное анализировать самостоятельно? Один из вариантов. Войти в "Я.Директ / Дать объявление /", внести одно слово в "ключевые слова", посмотреть рекомендуемый раздел подсказки "рубрики каталога: выбрать". В частности, рекомендуются разделы для размещения рекламы по ключевикам: "дизайн сайтов": / Hi-Tech / Интернет / Создание сайтов / Web-дизайн / "дизайн": / Hi-Tech / Интернет / Создание сайтов / Web-дизайн / "разработка сайтов": / Hi-Tech / Интернет / Создание сайтов / Web-дизайн / "продвижение сайтов": / Hi-Tech / Интернет / Создание сайтов / Web-дизайн / "поисковая оптимизация": / Hi-Tech / Интернет / Создание сайтов / Прочее / "оптимизация": [нет соответствий] "seo": / Hi-Tech / Интернет / Создание сайтов / Прочее / "спам": / Hi-Tech / Безопасность / Защита от спама / "пиво": / Дом / Кулинария / Пиво / "вино": / Дом / Кулинария / Алкогольные напитки / П.С. Спасибо Spark -у и Диме Пашко ("Ашманов и Партнеры") за помощь.

P

54

psu

18 ноября 2006, 17:47

#11

Lazarev:
Что-то я не полял как рубрики определять :) Помогите!!!

заходите в директ.яндекс (если нет логина нужно зарегистрироваться), потом дать объявление, сначала вылезет страница с общей информацией, введите там что-нибудь и кликните дальше:

там есть поле Ключевые слова - введите слово

и там есть поле Рубрики каталога - нажмите выбрать, яндекс сам поставит галочку в теме подходящий на его взгляд вашему запросу

Поломарь Станислав // web-it (http://www.web-it.ru/)

P

54

psu

18 ноября 2006, 17:48

#12

ну вот сами разобрались :)

[Удален]

18 ноября 2006, 17:56

#13

psu:
ну вот сами разобрались

Не, я и так это делал, но вот про галочки не знал... :)

1183

wolf

19 ноября 2006, 10:29

#14

Dervish:
берем некоторые слова страницы, которые будем условно считать "основными"
эти слова не должны входить в список стопов, должны иметь наиболее большую плотность

Скорее, по логике должна быть некая функция от частоты встречаемости слова в документе и его веса по общей коллекции документов. И тоже самое для пар, троек и т.д. слов. Те, что пройдут некий "кворум" и будут индикаторами тематики.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )

Уникализация документов (законы, право, ПФ боты ломятся на Адсенс Экспобанк

1030

Каширин

19 ноября 2006, 10:35

#15

Неужели мир готов поверить в то, что Яндекс умеет определять тематику документа???

Dervish:
берем некоторые слова страницы, которые будем условно считать "основными"

(курсив мой)

И какие именно слова назначим "некоторыми"? ;) Самые частые? 😎 Или по которым жаждем продвинуться? ;)

105

Alex Kirillin

19 ноября 2006, 10:43

#16

Каширин:
Неужели мир готов поверить в то, что Яндекс умеет определять тематику документа?

Кость, я вполне готов. Это простая машинная задача. Никто ж про ИИ и про то, что систему можно нае#$ть и не спорит. А примерно попытаться угадать с долей вероятности и внести эту угадайку в качестве коэффициента ранжирования - вай нот.

Александр Кириллин «Аладна» - Студия дизайна / Разработка сайтов (http://www.aladna.ru/) «Аладна» - Поисковая оптимизация / Продвижение сайтов (http://seo.aladna.ru/)

84

Dybra

19 ноября 2006, 13:40

#17

Alex Kirillin:
Никто ж про ИИ

А на самом деле все не так уж и сложно и все упирается в вычислительные ресурсы. Обычная задача самокластеризации, хорошо решается в нейросетевом логическом базисе.

Мы из ВЫКСЫ (http://wyksa.ru)!

105

Alex Kirillin

19 ноября 2006, 15:11

#18

Dybra:
задача самокластеризации, хорошо решается в нейросетевом логическом базисе.

"Люблю я юристов. Я бы просто на х#й послал, а они тоже самое, но на пяти страницах." (c) :)

228

nickspring

19 ноября 2006, 15:17

#19

Каширин:
какие именно слова назначим "некоторыми"? Самые частые? Или по которым жаждем продвинуться?

те, например, по которым может определяется уникальность текста (алгоритм шинглов и пр.).

84

Dybra

19 ноября 2006, 16:31

#20

Alex Kirillin:
"Люблю я юристов. Я бы просто на х#й послал, а они тоже самое, но на пяти страницах." (c) :)

Ну я, как бы это помягче выразиться, защитил дисер по искуственным нейронным сетям. Правда не в datamining (поиску знаний), а в нейроуправлении. :)

Open AI тестирует память для ChatGPT

Переиграть и победить: как анализировать конкурентов для продвижения сайта

Тематика документа