Максим, обсуждать пока совершенно нечего - все выглядит так, что Вы рекламируете кота в мешке.
Если так сильно переживаете, что кто-то может воспользоваться Вашей технологией, какой смысл был ее здесь анонсировать?
Статистика меня вообще-то не очень интересует. И в чем же "осмысленность"?
С днем рождения, Андрей!
Присоединяюсь ко всем пожеланиям. Побольше новых идей, сил и желания для претворения их в жизнь.
Я полагаюсь в основном на прикладной анализ данных. На чем основан Ваш алгоритм?
Возможно, я не слишком далек, но пока никак не могу понять, что же реально реализовано. Пока вижу, что все очень идеализировано :)
Алгоритм настолько хорош, что в нем нет слабых мест?
Не очень понятна математическая модель.
То есть алгоритм умеет определять тематическую направленность (фокус любого документа) и на ходу создавать пространство признаков для этого фокуса, в котором и производится поиск?
Почему-то при слове вселенная сразу пришла на ум теория Джордано Бруно о бесконечности Вселенной и бесконечности миров в бесконечно пустом пространстве.
Гм... Ну прям по Мулдашеву :) Ладно.
Что подразумевается под тематическими клонами?
Насколько я помню, граф не оставил после себя никаких архивов - ему вполне хватало собственной головы. Хотя кто знает, может он этот архив Вам сам и передал ;)
Сказано, конечно, сильно. Я почему-то был уверен, что природа открытий алогична. Вроде легенд, что Ньютону яблоко упало на голову, а Мендеелеву таблица элементов вообще приснилась во сне :)
Пока не понятно, что это за новая технология. Может, Вы все же сделаете небольшое введение? Например, что представляет собой N-мерное информационное пространство?
Да хотя бы на моем кратком пособии по поиску информации. Ссылка в подписи.
Поисковик не хранит самих html-тегов, только информацию о них.
Естественно, что веса рассчитываются относительно уже "очищенного" текста.
Netsah, как это ко всему коду? :) Сохраненный текст страницы в поисковике никогда смотреть не пытались?