Позвольте с Вами не согласиться. Мы активно изучали и изучаем современные работы по IR, подавляющее большинство которых датируется последним 10-летием. Кажется, что большинство прикладных результатов было получено как раз за этот период. Очень важна программная реализация технологии.
Вашу последнюю реплику оставляю без коментариев.
Мы не раскрываем технологические подробности функционирывания поискового механизма. Это политика любого не оpensource'ного разработчика. Не сочтите за дурной тон :)
Своя.
Как было сказано в предыдущем моем сообщении разработка интернет поисковика в ближайших планах компании.
А что касается скорости, то можете загрузить демо-версии одного известного украинского поисковика и одного не менее известного российского, взять нашу систему (ссылка вверху), а после проверить их на каком-то большом или маленьком объеме файлов и увидите какова разница.
Не называю наших конкурнетов (которые и так всем известны) что бы избежать обвинений в антирекламе.
Спасибо что пользуетесь DVYGUNом 🍻
По-первому.
Размер файлов означает сумму всех объемов, которые занимают на диске файлы попавшие в индекс. Для текстового файла объем самого фала и текста в этом файле равны. А вот для вордовского размер текста и самого файла конечно не совпадают. Размер файлов означает место которое они занимают на диске.
Размер индекса - сколько места занимают файлы индекса на диске.
По-второму.
Не думаю что это глюк. Просто перед тем как начать индексацию система проходит все указанные вами диски, директории и поддиректории для определения объема и количества файлов, которые будут проиндексированы. Если у Вас диски на 200 Гб, то это может занять время. После того как предварительный анализ будет завершен, система начнет индексацию файлов. Так что наберитесь терпения.:)