- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Подскажите, пожалуйста, существуют ли базы документов (больше интересует для английского) с прописанными численными значениями похожести между документами в этой базе (с точки зрения здравого смысла), чтоб можно было тестить на них свои алгоритмы категоризации текстов?
Подскажите, пожалуйста, существуют ли базы документов (больше интересует для английского) с прописанными численными значениями похожести между документами в этой базе (с точки зрения здравого смысла), чтоб можно было тестить на них свои алгоритмы категоризации текстов?
Базы документов не знаю, а вот поиск документов похожиз по содержанию есть в SearchInform и для тестировки хватит даже free версии у которой единственное ограничение -- индексит не более 1 гига. Ну а платные версии легко и полтера могут проиндексить.
Смотрите www.searchinform.ru
Спасибо, конечно, но мне надо потестить свои скрипты, а не ваши.
Странно, что никто здесь не написал про базы OHSUMED или Reuters, я бы их использовал, но не хватает вычислительной мощности, чтобы обсчитывать такие большие вектора.