- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Маркетинг для шоколадной фабрики. На 34% выше средний чек
Через устранение узких мест
Оксана Мамчуева
взял Ваш (Vyacheslav Tikhonov) текст: "Ни для кого не секрет, что современный интернет представляет..."
статсы анализатора:
всего слов 1857,
неизвестных: 256 ! о как ровно :)
время разбора: 1.6сек
несвязанных: 1002 (без учета неизвестных)
осмысливаемость: чуть более 50%
скорость: чуть более 1000слов в сек
Список неизвестных слов могу приложить.
к Vyacheslav Tikhonov:
в статье Вы пишете:
====ищем фразу "расписание всех поездов, проходящих через Самару", то при отсутствии такой же фразы расписание всех поездов, проходящих через Киев система определит, что они имеют 5 общих слов, то есть с большой вероятностью страница, содержащая эту фразу вам подойдет, хотя это и не так. Поэтому нужно такой запрос скорректировать, убрав все слова-паразиты и оставив только слова, которые точно характеризуют вашу потребность. В нашем случае словами-паразитами являются слова: всех, проходящих, через. ======
Как раз для осмысленного поиска это не слова-паразиты, а даже наоборот - слова-помошники, ибо благодаря им будет найдена только нужная пользователю инфо.
статсы анализатора:
Статистика меня вообще-то не очень интересует. И в чем же "осмысленность"?
2icreator
А можно более подробно, что собой представляет ваша база знаний.
Какие типы обьектов в ней хранятся, какие типы связей?
2icecreator
Бывают моменты, что пользователь сам не знает точно или не может сформулировать - ЧТО ОН ИЩЕТ.
Присоединяюс к вопросу "что такое осмысленность" в ващем понимании? Можно ли поподробнее?
Спасибо
-это характеристика текста или "осмысливающей" программы? :)
инфо по Системе о-поиска на моем сайте представлена:
www.icreator.ru\isearch
Это все, безусловно, здорово, на что реально удалось вытащить из моего документа?
инфо по Системе о-поиска на моем сайте представлена:
www.icreator.ru\isearch
Когда говорят о системе, основанной на
синтаксическом анализе, мне лично хочется получить ЧЕСТНЫЕ ответы на следующие два вопроса:
1) проводили лы Вы проверку синтаксического разбора на корпусе
текстов величиной в 1 Мбайт?
(а лучше для текстов разных жанров)
2) какой процент предложений разобран правильно, какой частично
правильно (с незначащими ошибками), какой процент ошибочных из
разобранных, сколько не разобрано.
Если эти цифры для хороших не превосходят 50% (что обычно), то, к сожалению, надо сильно постараться, чтобы найти приложение, где это может работать (а тем более поискать, где это будет лучше работать, чем более простые методы).
Кроме того, у Вас упоминается Prolog - для синтаксического анализа требуются базы правил большого размера - а у реализаций Prolog'a с этим ранее были проблемы.
То есть вопрос - какой размер Вашей базы правил?
1) проводили лы Вы проверку синтаксического разбора на корпусе
текстов величиной в 1 Мбайт?
(а лучше для текстов разных жанров)
на размере 437кБ формата .txt
2) какой процент предложений разобран а)правильно, какой б)частично
правильно (с незначащими ошибками), какой процент в)ошибочных из
разобранных, сколько не разобрано с).
я сейчас посмотрел на реальном тексте, результаты не ахти:
а) -0%, б) частично правильно имеется ввиду связи некоторые установлены, но среди них нет неправильных - 80%, в) 20%, с) - в каждом что-то да связано. Но процент связывания не по предложениям, а по словам: около 35% - количество слов учавствующих в связях к общему числу слов. Тут нужно заметить что:
- оключена обработка наречий
- отключен поиск подчинения прелогов
- отключен поиск починения существительных глаголу
- отключена обработка причастий
- не работает обработка списков
- не работает обработка частиц (а, но, и, или, не...)
- не работает связывание местоимений
Если эти цифры для хороших не превосходят 50% (что обычно), то, к сожалению, надо сильно постараться, чтобы найти приложение, где это может работать (а тем более поискать, где это будет лучше работать, чем более простые методы).
думаю что в интерент-поиске очень даже должно пригодиться.
Кроме того, у Вас упоминается Prolog - для синтаксического анализа требуются базы правил большого размера - а у реализаций Prolog'a с этим ранее были проблемы.
То есть вопрос - какой размер Вашей базы правил?
ПроЛог я использую ViP 5.0 - у него таких проблем нет. Есть проблема со скоростью работы с фактами - то есть тормоза по сравнению с использованием обычных переменных в обычных алгоритмических языках программирования налицо, хотя относительно других ПроЛогов факты у ViP очень быстрые.