- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Да, пока другого решения мы не нашли. Если оно появится, и будет озвучено в этой теме, буду премного благодарен.
А про это где можно почитать подробнее?
наберите в гугле classification и читайте. или начните отсюда http://en.wikipedia.org/wiki/Document_classification
Не следует забывать и о технике глобальной классификации которую делают в Абби Лингво
Не следует забывать и о технике глобальной классификации которую делают в Абби Лингво
тогда уж не забывать об искусственном интеллекте, DM, BI, и конечно, о серебрянной пуле и чесноке
Абби в 1999 году все обещал сделать глобальную штуку, теперь сейчас обещает - наверное им надо раз в пять-шесть лет обещать, а то все забывают об их глобальных замыслах
Что поделать - трудоемкая задача, вопрос лишь в том на сколько глубко решили абстрагироваться.
Что поделать - трудоемкая задача, вопрос лишь в том на сколько глубко решили абстрагироваться.
дело не в степени абстрагирования, а в подходе
на паровозе до луны не доехать
Про классификацию... Мы строили разные решения, одно из них построено на нашем продукте Document Comparator - который определяет проксимацию (близость) смыла 2-х и более документов. Тогда решение задачи сводится к созданию базы эталонных документов в ручную «разложенных» по разным темам. Далее, каждый новый документ сравнивается с эталонными тематическими документами, в результате чего получаем веса которые задают степень близости документа к той или иной теме (шаблонному документу или их группе). И можно сказать, что на столько-то % документ близок в одной теме, а настолько % - к другой. Такой салюшен назван у нас категоризатор, демки нету, вот демка (вернее игрушка) компаратора, на основе которой построен категоризатор.
http://comparator.intellexer.com/demo_comp.php
Другое решение называется кластеризатор - определение смысла документа. Часто используется для группировки результатов поиска. Наша тула работает очень похоже на результаты поиска clusty.com (насколько я помню они для AOL батрачили)
Вот как выглядят результаты работы кластеризатора.
http://clusty.com/search?input-form=clusty-simple&v%3Asources=webplus&query=summarizer
Ну и еще одно решение – суммаризация (автореферирование) – задача вытянуть из текста n предложений содержащих передающий основной смысл документа. На основе таких summary намного легче делать классификацию документа.
Для анг. текстов нашу online демку можно посмотреть тут: http://summarizer.intellexer.com/summ_demo_v2.php
Когнитивно:)
Мы строили разные решения, одно из них построено на нашем продукте ...
Другое решение называется ...
Ну и еще одно решение ...
Опять реклама.
Хочется рассказать о своем - пожалуйста, но хоть имейте совесть, приводите результаты сравнительного с другими подходами evaluation, хотя бы обсуждайте достоинства и недостатки, хотя бы ссылки на тех (западных) людей, кто публиковался с подобными подходами ранее, а то скоро пойдет в ход "семантический анализ" и т.д.
Кстати, если что-то называется "решение", а не просто "экспериментальный алгоритм", то должно быть хотя бы одно масштабное внедрение, или несколько не столь масштабных.
Тщательнее надо...
"... нужны доки только определённой тематики, как определить приблизительную хотябы вероятность того, что док относится к нужной мне тематики?"
AdultGO, Вы не сказали ни слова о том, КАК (ЧЕМ) у Вас задана "определённость тематики" ...