Гуглее искалки не было и нет! Готов гуглиться до старых лет

F
На сайте с 15.11.2000
Offline
116
1908

Google в очередной раз порадовал, добавив к формату PDF поиск ряда новых форматов:

  • doc - Word,
  • xls - Excel,
  • ppt - презентации PowerPoint,
  • rtf - RichText формат,
  • ps - PostScript.

На сегодня Гугл проиндексировал более 22 миллионов PDF-файлов. Конечно, перечисленные форматы встречаются заметно реже HTML и даже PDF (исключая PS), но зато в них гораздо чаще находится документация и научные статьи (именно это в нововведении привлекает меня больше всего).

Если вы хотите поискать, например, все doc-файлы о поисковых машинах, достаточно ввести:

search engine filetype:doc

Подробности:

Google Unveils More of the Invisible Web (SearchEngineWatch)

С уважением,

Александр Садовский.

F
На сайте с 15.11.2000
Offline
116
#1

Еще новость: Google начал ходить по flash-ссылкам. Он еще не индексирует flash, но уже знает о страницах, на которые тот ссылается.

С уважением,

Александр Садовский.

S
На сайте с 30.09.2001
Offline
34
#2

Вариантов два - индексировать комментарии типа <!-- URL used in this movie --> (если они есть) или просматривать swf-файлы как простой текст, УРЛы, вроде, там вылавливаются. Последнее, кстати, потенциальный метод борьбы с флэшевыми редиректами.

Кстати, из спортивного интереса посчитал, минимальный вес flash-редиректа: 38 байт (не считая числа символов в УРЛе).

Владимир

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий