NULL

Рейтинг
212
Регистрация
29.01.2003

http://www.rocit.ru/news/shownews.php3?id=21585

Таки правда. Есть и googlemail:// и google_im://

Итак, мое мнение совпадает

Kostya, мне почему-то показалось, что Ваше мнение с мнением Алексея не совсем совпадает. :)

P.S. Мне понравилась оперативность менеджеров апортовского каталога.

На сетевых (замапленых) дисках документы не индексирует.

Ага, для динамических страниц не всегда корректно может быть посчитан PR, а также вИЦ

Дмитрий, а можете привести пример когда это - "не всегда"?

Как я понял, эта штука индексирует только файлы в разделе, где система установлена?

Не так. Что именно она индексирует, написано на http://desktop.google.com/index.html, под Internet Explorer подразумевается кеш IE ("%USERPROFILE%\Local Settings\Temporary Internet Files\"), документы Word и Excel находит на всех логических дисках (замапленные не проверял).

1. Я не хочу чтобы робот индексировал папку admin(панель управления сайта), выхолд писать - Disallow: /admin/ но не хочется всем показывать как эта папка называется(хоть и есть там авторизация, но все же). Как поступить?

Не указывайте в robots.txt ничего. Если ауторизация на /admin/ сделана нормально, то индексирующие боты не пойдут дальше и светить ничего не будете.

4. Еще я где-то читал что файл роботс.тхт надо как-то сохранить в юникс-режиме(формате) Так ли это? В виндовсе его не сохранишь?

Упоминание "юникс-формата" касалось перевода каретки, если не будете редактировать robots.txt в Ворде, а сохраните в виндузовом блокноте, то ничего страшного не будет.

Как раз было бы очень странно если бы они туда попали - два-три десятка мартышек подобрали бы за неделю "правильный рецепт" для Большого Брата.... А кешированные странички обслуживаются???

По кешированным страницам тоже ищет, в кеш попадают в том числе и страницы вида http://localhost/siteN/... Так что для "мартышек" не все потеряно 😂

Этот GDS (Google Desktop Serch) также внедряет свою библиотеку (GoogleDesktopNetwork1.dll) ко всем запущенным процессам. Так кажется, что этот хук нужен для отслеживания тех документов, которые нужно переиндексировать. Как-то очень мудрёно, тем более, что еще одна библиотека GoogleDesktopNetwork2.dll сначала подгружается к любому приложению, а потом выгружается. Непонятные подтанцовки. Рядышком с GoogleDesktop.exe лежит gzlib.dll, такое впечатление, что индексные файлы перепакованы в модифицированный GZ архив (обычные архиваторы не открывают).

За 2 часа проиндексировал все. Как ни странно, в индекс не попали локальные копии сайтов ... вот это сюрприз! Непонятно, по какому принципу для одних страниц из кеша генерится превьюшка, а для других - нет. По умолчанию сортирует найденные документы по дате, но есть интересная педаль - "Sort by relevance"!

За час работы проиндексировала 20K файлов, каталог с индексом вырос до 200 Мб. Тормозов при индексировании совсем не почувствовал. Интеграция локальных результатов и глобального поиска - очень приятная фенечка. Вордовые документы шерстит великолепно. Среди процессов висит сразу 3 молодца:

GoogleDesktop.exe

GoogleDesktopCrawl.exe

GoogleDesktopIndex.exe

но памяти и CPU отъедают весьма умеренно. О неприятном - индексирует только кеш IE, другие браузеры (Mozilla Firefox, Opera 7) не понимает.

magic, большой респект!

Всего: 1163