Как Яндекс определяет тематику сайта?

12
D
На сайте с 09.08.2009
Offline
22
#11
anatolytver:
Неправда. На один из моих сайтов, который я купил на аукционе, стоит всего лишь 10 ссылок с сателлитов той же тематики, при этом никаких намеков на ЯК или директ. Итого: 10 ссылок = 10 ТИЦ.

И это абсолютно нормально... Какое это имеет отношению к тематике, или написанному мной? Я тоже могу вам привести пример сайта, где всего с десяток ссылок и ТиЦ 10, но это не значит что ему уже присуждена категория.

Обмен вебмани (https://rostov-wm.ru/) - Лучшие комедии (http://kinoteka.su/) - Онлайн футбол (http://betexplorer.ru/futbol_tv.html)
The WishMaster
На сайте с 29.09.2005
Offline
2542
#12
anatolytver:
На один из моих сайтов, который я купил на аукционе, стоит всего лишь 10 ссылок с сателлитов той же тематики, при этом никаких намеков на ЯК или директ. Итого: 10 ссылок = 10 ТИЦ.

Гениальный вывод!

Кому старенького креативного копирайтера? Тематики - туризм, СЕО, творчество, кулинария, шизотерика :)
anatolytver
На сайте с 12.01.2008
Offline
50
#13
Dendy:
И это абсолютно нормально... Какое это имеет отношению к тематике, или написанному мной? Я тоже могу вам привести пример сайта, где всего с десяток ссылок и ТиЦ 10, но это не значит что ему уже присуждена категория.

У меня есть другие примеры, более убедительные.

И все же, мне кажется, дело не совсем в категории, а в словах. И никакие категории не присуждаются, если сайт не в ЯК.

The WishMaster
На сайте с 29.09.2005
Offline
2542
#14
anatolytver:
И никакие категории не присуждаются, если сайт не в ЯК.

Ты издеваешься?

zZmeIOka
На сайте с 30.05.2007
Offline
269
#15

The WishMaster, обсуждать здесь что-то бессмысленно, начиная с первого поста...

Dallas184
На сайте с 30.04.2009
Offline
45
#16
томаз:
Берется каталог(ЯК), разбивается на слова, высчитывается частота для каждого слова(словоформы не учитываются), далее берется тема опять же из ЯК, высчитывается частота слов в теме, потом высчитываются две вероятности:
1. Вероятность того что если встретилось слово то документ в теме
2. Вероятность того что если слово встретилось то документ не в теме
Далее анализируется текст тематику которого надо определить, и находятся темы близкие этому документу.
При фасетной организации эталонного каталога, тема более менее ярко выражена."

На этой основе работает этот скрипт определения тематики. Скорее всего он работает так: считает слова в документе и сравнивает с ранее отпарсенной базой ЯК, из чего делает вывод о тематике сайта.

А по поводу тица, ТС, а что мешает провести эксперимент? Накачайте тематичными текстами 10 сатов и слинкуйте. Побалуйтесь с кол-во совпадений и все вопросы у вас сами собой отпадут.

P.S. Золотое правило форума: тот кто много знает, до всего дошел сам, экспериментируя и тратя свое время и деньги и он вам просто так ответом на вопрос не спалит свои темы.

KU
На сайте с 09.07.2009
Offline
61
#17
томаз:


деза

пруф .

Karl_ung добавил 10.11.2009 в 10:57

томаз:
"считает слова в документе и сравнивает"

это приметив.

сравнивается СМЫСЛ.

а смысл, это содержание в форме...

звездная карта...

с дырочками такая, как в кин-дза-дза, че то там в центуре...

Джордж Зипф доказал обратное.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий