Определение тематики документа. ТЕОРИЯ.

12
Nikitoz
На сайте с 11.09.2006
Offline
21
#11

Статьи

http://www.metric.ru/publications.asp?ob_no=308

http://www.seotools.ru/biblioteka-optimizatora/avtoritety-rekomenduyut/an/ostap-bender.html

По теме, думаю,что адекватные алгоритмы определения тематичности уже давным-давно существуют, что видно из первой статьи, но вот как эти алгоритмы заточить под ПС , с учетом ограниченности ресурсов поисковой машины и огромного количества материала, вот это вопрос, который имеет наибольший приоритет в данный момент.

Bor-ka
На сайте с 16.11.2004
Offline
256
#12

Nikitoz, большое спасибо за материал!

DrJeans
На сайте с 06.07.2006
Offline
231
#13
Bor-ka:
сайт или страница сайта?

Допустим страница с развёрнутой темой: Колорадский жук, родина, ареал обитания, размножение, плодовитость, дальность полёта, карантин растений, как метод борьбы с насекомым или производство инсектицидов - микробиологическая индустрия.

Bor-ka:
именно так. на счет северной америки не уверен.

Родина колорадского жука - Северная Америка. В Европе впервые обнаружен во Франции в 1922 и в дальнейшем проник почти во все страны.

Bor-ka:
только все этиматики имеют определенные соотношения для конкретной страницы.

Опять же, допускаю... Но! Цитата из приведённого выше текста:

Публикации доклада предшествовало появление на Рамблере инструмента просмотра ассоциативных запросов "у нас еще ищут...". Лично я сталкнулся с данным алгоритмом до публикации доклада, занимаясь продвижением туристического сайта, ориентированного на "отдых в Тайланде". Достаточно неожиданно на первую страницу Рамблера стали подниматься документы, содержащие мало информации о Тайланде, но включающие перечисление "туров в Турцию" и "отдыха в Египте". Как оказалось, многим пользователям Рамблера "побарабану", куда ехать на пляжный отдых - и они перебирали подряд все возможные жаркие страны. Рамблер послушно создавал списки асооциированных запросов, поднимая в выдаче документы, содержащие все варианты названий стран пляжного отдыха.

Поведение целевой аудитории может внести существенные коррективы в любые попытки увязать тематики в стройную логическую цепочку, так же как статистическое возмущение непредсказуемо в наблюдении соотношения количества мужчин и женщин на улице в определённые часы. Неожиданно из-за угла может выйти рота солдат и нарушить все Ваши выводы...

Спроси на Boosty: https://boosty.to/smorovoz SEO на Ютубе: https://www.youtube.com/@youtube-seo/
Bor-ka
На сайте с 16.11.2004
Offline
256
#14
DrJeans:
Допустим страница с развёрнутой темой: Колорадский жук, родина, ареал обитания, размножение, плодовитость, дальность полёта, карантин растений, как метод борьбы с насекомым или производство инсектицидов - микробиологическая индустрия.

ну Вы слишком страшный пример привели :) меня больше интересовало определение тематики документов несколько другого типа. Естественно прикладное применение планируется не для ПС :)

поведение использовать не могу, т.к. не ПС.

greenwood
На сайте с 08.09.2003
Offline
519
#15

Я точно не знаю но по наблюдениям за гугль адсенсом можно сказать следующее :

скорее всего есть база кевордов рекламодателей по адвордсу и если слово встретилось на страничке то в блоке начинает мелькать реклама

Если нет совпадения, то крутится социалка или (совсем не уверен) по банальной плотности на страничке.

конечно всё это мало относится к вопросу топикстартера, но пусть будет как ремарка.

Bor-ka
На сайте с 16.11.2004
Offline
256
#16

greenwood, алгоритмы определения тематики у систем контекстной рекламы (Бегун,Директ и т.п.) имеют похожий принцип, хотя у них получается несколько другие вариации на эту тему - нашел слово - есть в базе объявления на слово(или слова) - показываем.

ostmaster
На сайте с 01.09.2002
Offline
222
#17

Там немного сложнее, есть еще привязка к общей тематике сайта, а не только к ключевым на странице.


Тестирование мобильных приложений и сайтов (/ru/forum/1032925) https://www.facebook.com/ostmaster (https://www.facebook.com/ostmaster)
greenwood
На сайте с 08.09.2003
Offline
519
#18
ostmaster:
Там немного сложнее, есть еще привязка к общей тематике сайта, а не только к ключевым на странице.

все верно, но вот на блогах уже несколько тяжелее определить тематику ...если она там вообще присутствует

А блоги сейчас ... сами знаете их значение для поисковиков ...

mustafa
На сайте с 28.10.2005
Offline
202
#19

Bor-ka, вот с теорией и практикой и ссылками на офф источники

Nikitoz
На сайте с 11.09.2006
Offline
21
#20

Вот, еще наткнулся на кое-какую информацию.

http://www.gpntb.ru/win/elbib/trud2/08_1999.html

Правда, для поисковых систем с их индексом, все это не годится.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий