- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Может ли кто подсказать, по какому принципу (хотя бы теоретически) происходит кластеризация на этих ресурсах (или как она могла бы происходить)?
Прочитал всю ветку "Технических вопросов", но информации не нашёл...
Если кто кинет сылками, или что объяснит - буду премного благодарен - а то не знаю куда рыть...
кое-какие идеи можно почерпнуть из обсуждения здесь
http://groups.yahoo.com/group/romip/message/148
Спасибо!
Если будут ещё какие ссылки и/или ключевые слова для поиска буду весьма благодарен (в том числе и по автоматическому аннотированию).
Странно. А ведь вопрос уже обсуждался, причем с представителями Яндекса.
Vyacheslav Tikhonov, да эту тему я, конечно, читал. Только там для человека в этой теме не сведущего там нет ничего кроме общего диагноза: "это очень сложно"... =|
Конечно, для понимания нужно хотя бы немного владеть терминологией.
Для начала советую почитать, что такое
TDT - Topic Detection and Tracking.
TDT призвана решить следующие задачи:
1. Сегментация статей (Story Segmentation) - задача разделения непрерывного потока на новости, связанные одним и тем же событием.
2. Отслеживание новостной дорожки (Topic Tracking) - нахождение всех новостей, которые "похожи" на множество эталонных новостей. Используется для отлова всех потенциально интересных документов по теме, которые могут появиться в будущем.
3. Определение дорожки (Topic Detection) - кластеризация всех новостей, порожденных конкретным событием.
4. Определение первой новости в дорожке (First Story Detection) -
для нахождения самого первого сообщения в новом событии.
5. Определение связей (Link Detection) - позволяет определить, порождены ли две новости одним и тем же событием.
Вам какую задачу нужно решить?
Вячеслав, да именно это. Плюс автоматическое аннотирование.
Где можно почитать более подробно (кроме указанной Вами ссылки)?
В Google. :)
Спасибо, это я и так знал, блин =)
Возможно есть какие-нибудь сайты, статьи, форумы, мейл-листы где есть обсуждения на эту тему? Что-то сродни этого тематического подфорума на котором мы сейчас находимся?
Возможно есть какие-нибудь сайты, статьи, форумы, мейл-листы где есть обсуждения на эту тему?
Кстати, если не секрет, а что за проект? Я в TDT немного разбираюсь. :)
Вячеслав, извиняюсь за столь запоздалый ответ, но, как выяснилось уведомление по почте не работало (бесплатная почта... =/ ).
Насчёт проекта - не секрет. На данный момент это в большей степени личный интерес.
Если не сложно, подскажите, пожалуйста, откуда с TDT можно начать разбираться (кроме вышеупомянутых источников)?