Доказательство того что яндекс учитывает окружение ссылок

di_max
На сайте с 27.12.2006
Offline
262
#101

Пришлось как-то делать нечто, типа "автоматического каталогизатора".

При всей сложности задачи, програмная часть была небольшой.

Все свелось к "словарям" по темам и словарям синонимов.

После "проката" были отсеяны самые "популярные" и самые "редкие" слова, за

исключением обще-литературных слов, которые есть даже в ISPEL.

имхо, где, как не у Янь, самые полные словари?

имхо, такая задача реальна... Наверное вопрос времени.

Перелопатить всю Базу Яня на этот предмет...

// Все наши проблемы от нашего не знания...
A
На сайте с 25.10.2005
Offline
219
#102

Разработчик,

Так для Яндекса "тематика" - это только рубрика ЯК. Определять тематику точнее - это задача для ИИ - ПС вряд ли сейчас ставят перед собой задачу создания ИИ.

di_max
На сайте с 27.12.2006
Offline
262
#103

Проверив релевантность этого форума на предмет всяческих "ангедридов, хлоридов и гликолей", можно с 99,99% уверенностью утверждать, что этот форум не относится к разделу "Химия" и химической пром-ти.;)

Р
На сайте с 23.05.2006
Offline
258
#104

alut, пусть MiRaj снова "умилится", но ссылка на фразу Яндекса "мы учитываем текст со страницы, на которой стоит ссылка" на форуме была. И "рабочие" алгоритмы, имхо, есть..

T.R.O.N:
Если Вас интересует это вопрос "по сути" - могу поделится реальными алгоритмами и не тольок своими.
di_max:
можно с 99,99% уверенностью утверждать, что этот форум не относится к разделу "Химия" и химической пром-ти.;)

Не может быть..А если через 15 минут в Курилке тема появится с названием "отравился дигидридниколем", то что даст Ваш анализ?

T.R.O.N
На сайте с 18.05.2004
Offline
314
#105

DrJeans, с "космотнавтами", все просто. А вот причины появления/исчезание тематик у сайтов некаталогжных - пока факт, но загадочный. Может глюк, может "пробы пера".

А по поводу тематичности.. Тематику страницы определить, все просто. Сайта - уже сложнее. А вот что яша считает однотематичными сайтами, и чем он при этом руководствуется - ??? и большой

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
T.R.O.N
На сайте с 18.05.2004
Offline
314
#106
Разработчик:
Будем ждать тогда..

А зачем, или тоже всерьез заинтересовались тИЦем, или тематичность ссылок стала рулить и в остальных направлениях.

di_max
На сайте с 27.12.2006
Offline
262
#107
Разработчик:
Не может быть..А если через 15 минут в Курилке тема появится с названием "отравился дигидридниколем", то что даст Ваш анализ?

Всю туже точность... Каково % соотношение "дигидридниколем" к общей массе слов на этом форуме?

Точно также можно выделить наиболее часто употребляемые жаргонизмы этого форума, которые во многих других отраслях не встречаются...

Я не говорю - насколько Яндекс это использует.

Р
На сайте с 23.05.2006
Offline
258
#108
T.R.O.N:
А по поводу тематичности.. Тематику страницы определить, все просто. Сайта - уже сложнее. А вот что яша считает однотематичными сайтами, и чем он при этом руководствуется - ??? и большой

Просто? Ок, тогда оцениваем тематичность всех исходящих ссылок со страницы и вот она, градация по тематичности ссылки?

Р
На сайте с 23.05.2006
Offline
258
#109
di_max:
Всю туже точность... Каково % соотношение "дигидридниколем" к общей массе слов на этом форуме?

Всё ту же - значит по-прежнему "никакую" :) Больше знаков после запятой нужно использовать)

Boris Shramko
На сайте с 18.01.2006
Offline
116
#110
T.R.O.N:
Тематику страницы определить, все просто.

\

есть примеры когда Яндекс лагает с определением тематики для страницы (судя по выдаче дирета)

308827355

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий