- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Ранее я писал что осмысленный поиск (www.icreator.ru/isearch)
работает очень медленно при вводе ЕЯ во внутреннюю базу знаний - всего лишь на порядок быстрее чем читает ЕЯ текст человек. Теперь я переделал синтаксический анализатор, ускорив разбор ЕЯ но при этом ухудшилось качество: в ЕЯ тексте уменьшилось число распознанных смыслов. Привожу статистику для нового анализатора на моем железе (800дюрон, винт 66АТА, язык программы: Visual Polog 5 executable):
-размер ЕЯ файла: 54115слов
-из низ неизветных ( которые Система не знает и соответсвенно не смогла использовать их в построении смысла предложения): 5236
-несвязанных слов (слова не учавствующие в каком-либо смысле): 24292
-итого "осмысливаемость": 50%
-время разбора ЕЯ:53сек
-итого скорость "осмысливания": 1000слов/сек
Здесь все словоформы были загружены в оперативку предварительно. Замечу что на самом деле процент связываемости выше, так как некоторые слова и не должны быть связаны в "смысле". по моим расчетам реально "осмыслено" 70%.
В предыдущей версии Системы анализатор примерно 10слов в секунду "осмысливал", но % связывания был выше.
Если отключить связывание деепричастий, то скорость возрастает на 30% а "осмысливаемость" упадет на 10%.
В анализаторе пока не работает обработка списков.
Как Вы считаете - такая скорость уже больше подходит для сбора инфо в инете для базы поисковика? Или еще нет?
Скорость поиска "смысл"а в "смыслах" пока не привожу.
icreator, здесь собрались одни материалисты ;)
Вы что-то реально работающее можете показать?
что есть в Вашем понимании "реальное"? программа работающая (анализатор+поиск) - это реальное? или нужен поисковик коммерческий?
Вполне. Вот и любопытно было бы на такую программу глянуть, только не с "подкрученными" исходными данными (которые даются в качестве примера и под которые можно подстроить результат), а с собственными.
ну так укажите в инете файл на котором вам интересно статсы посмотреть на мой анализатор (без поиска)
кстатит тест проводил на файле:
"РОССИЙСКАЯ ФЕДЕРАЦИЯ
ТРУДОВОЙ КОДЕКС РОССИЙСКОЙ ФЕДЕРАЦИИ"
взятом с библиотеки Мошкова кажись
Да хотя бы на моем кратком пособии по поиску информации. Ссылка в подписи.
Раз уж разговор зашел о проверке работы поисковых алгоритмов - то где можно взять более-менее универсальный тест для оценки работы поисковой системы?
Раз уж разговор зашел о проверке работы поисковых алгоритмов - то где можно взять более-менее универсальный тест для оценки работы поисковой системы?
См.
соседний топик
либо TREC
либо CLEF
В первую очередь интересны тесты для русскоязычных текстов.
Конечно, я видел этот интересный семинар, он к сожалению платный, с другой стороны он, видимо, будет напоминать соревнования "черепахи со страусом".
Надеюсь, что результатом таких семинаров будет появление программы стандартных тестов любой псевдопоисковой машины на хорошем корпусе текстов с разнообразнейшими запросами и оценками.
В первую очередь интересны тесты для русскоязычных текстов.
В настоящее время это только CLEF (40 Мбайт Известий-1995) и РОМИП.
Конечно, я видел этот интересный семинар, он к сожалению платный, с другой стороны он, видимо, будет напоминать соревнования "черепахи со страусом".
Участие в семинаре в этом году, думаю, будет БЕСПЛАТНЫМ
(вроде бы получен грант РФФИ на оплату проверяющих).
РОМИП - не пузомерка - никто не собирается всерьез сравнивать
разные системы, поставленные в разные условия.
Речь идет об исследовании на практике неясных вопросов.
Надеюсь, что результатом таких семинаров будет появление программы стандартных тестов любой псевдопоисковой машины на хорошем корпусе текстов с разнообразнейшими запросами и оценками.
Я думаю, что ккасается РОМИП этот вопрос будет решен в ближайшее время.