Комментарии - Ken - Профиль вебмастера - Форум об интернет-маркетинге

Головоломка (VSM и dimensionality reduction)

1 марта 2007, 18:16

Новости.

Есть N источников предоставляющих тексты T.

Допустим, они освещают явления X.

Нужно найти явления F(T,N) ={X1,X2...}, далее определить лжеисточники. и.т.д

Головоломка (VSM и dimensionality reduction)

26 февраля 2007, 17:35

PHWizard:
А что бы ты предложил?

Если б я знал какую метрику предложить...

Рассмотренные выше выкладки - замечательные.

Но... судя по тем тестам, что мне удалось делать, я пришел к выводу - априори "Частоты шумят" и вылезают за пределы той самой статистической ошибки.

Головоломка (VSM и dimensionality reduction)

21 февраля 2007, 18:24

Ну вот🙅 опять все свелось к частотам.

определение вероятности тематики докумета

25 ноября 2006, 19:47

% вхождения - это слишком простая мера - тут хотябы термины в кластер собрать.

определение вероятности тематики докумета

9 ноября 2006, 17:51

Когнитивно:)

определение вероятности тематики докумета

3 ноября 2006, 17:55

Что поделать - трудоемкая задача, вопрос лишь в том на сколько глубко решили абстрагироваться.

определение вероятности тематики докумета

2 ноября 2006, 17:22

Не следует забывать и о технике глобальной классификации которую делают в Абби Лингво

Словоформы

24 июля 2006, 17:46

Eugen:
Кстати, кто что думает по-поводу нормализатора от AOT ?

По скорости не тестировал, а вот наполнение словаря понравилось, хотя... наличие или потенциальность тех или иных словоформ - вещь довольно абстрактная.

Слово "звздолет" - которое качевало в некоторых версиях словарей (и даже Лингво) присутствует и в АОТе. Иными словами: первоисточник - один.

Словоформы

13 июня 2006, 17:47

seodev:
Кстати, создается ощущение, что morphology.ru - это ispell в чистом виде. Без "автоматической" морфологии для слов, отсутствующих в словаре.

Совсем не ispell. (Решение комплексное)

Поисковая система Adre - ваши мнения.

16 мая 2006, 14:43

на запросы крис норман и криса нормана

выходят разные результаты - так и задумано?

Вышел новый Яндекс Браузер с YandexGPT и YandexART

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ

Ken