Тематика документа

P
На сайте с 17.05.2006
Offline
54
psu
#11
Lazarev:
Что-то я не полял как рубрики определять :) Помогите!!!

заходите в директ.яндекс (если нет логина нужно зарегистрироваться), потом дать объявление, сначала вылезет страница с общей информацией, введите там что-нибудь и кликните дальше:

там есть поле Ключевые слова - введите слово

и там есть поле Рубрики каталога - нажмите выбрать, яндекс сам поставит галочку в теме подходящий на его взгляд вашему запросу

Поломарь Станислав // web-it (http://www.web-it.ru/)
P
На сайте с 17.05.2006
Offline
54
psu
#12

ну вот сами разобрались :)

[Удален]
#13
psu:
ну вот сами разобрались

Не, я и так это делал, но вот про галочки не знал... :)

wolf
На сайте с 13.03.2001
Offline
1183
#14
Dervish:
берем некоторые слова страницы, которые будем условно считать "основными"
эти слова не должны входить в список стопов, должны иметь наиболее большую плотность

Скорее, по логике должна быть некая функция от частоты встречаемости слова в документе и его веса по общей коллекции документов. И тоже самое для пар, троек и т.д. слов. Те, что пройдут некий "кворум" и будут индикаторами тематики.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
Каширин
На сайте с 03.01.2004
Offline
1018
#15

Неужели мир готов поверить в то, что Яндекс умеет определять тематику документа???

Dervish:
берем некоторые слова страницы, которые будем условно считать "основными"

(курсив мой)

И какие именно слова назначим "некоторыми"? ;) Самые частые? 😎 Или по которым жаждем продвинуться? ;)

Alex Kirillin
На сайте с 11.01.2004
Offline
105
#16
Каширин:
Неужели мир готов поверить в то, что Яндекс умеет определять тематику документа?

Кость, я вполне готов. Это простая машинная задача. Никто ж про ИИ и про то, что систему можно нае#$ть и не спорит. А примерно попытаться угадать с долей вероятности и внести эту угадайку в качестве коэффициента ранжирования - вай нот.

Александр Кириллин «Аладна» - Студия дизайна / Разработка сайтов (http://www.aladna.ru/) «Аладна» - Поисковая оптимизация / Продвижение сайтов (http://seo.aladna.ru/)
Dybra
На сайте с 23.10.2005
Offline
84
#17
Alex Kirillin:
Никто ж про ИИ

А на самом деле все не так уж и сложно и все упирается в вычислительные ресурсы. Обычная задача самокластеризации, хорошо решается в нейросетевом логическом базисе.

Мы из ВЫКСЫ (http://wyksa.ru)!
Alex Kirillin
На сайте с 11.01.2004
Offline
105
#18
Dybra:
задача самокластеризации, хорошо решается в нейросетевом логическом базисе.

"Люблю я юристов. Я бы просто на х#й послал, а они тоже самое, но на пяти страницах." (c) :)

nickspring
На сайте с 29.03.2006
Offline
228
#19
Каширин:
какие именно слова назначим "некоторыми"? Самые частые? Или по которым жаждем продвинуться?

те, например, по которым может определяется уникальность текста (алгоритм шинглов и пр.).

Dybra
На сайте с 23.10.2005
Offline
84
#20
Alex Kirillin:
"Люблю я юристов. Я бы просто на х#й послал, а они тоже самое, но на пяти страницах." (c) :)

Ну я, как бы это помягче выразиться, защитил дисер по искуственным нейронным сетям. Правда не в datamining (поиску знаний), а в нейроуправлении. :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий