Файловая поисковая система.

12
A
На сайте с 08.06.2006
Offline
5
4340

Хотел бы обсудить необходимость/возможность создания файлового поисковика, не FTP а www ссылок. Всем известно что на www лежит очень много контента, может не всегда качественного, но все же, а поисковика по файлам нормального просто нет. Может я не просвящен и он уже давно есть, хотел бы послушать мнения.

gegabit
На сайте с 30.05.2005
Offline
13
#1
adamrich:
Хотел бы обсудить необходимость/возможность создания файлового поисковика, не FTP а www ссылок. Всем известно что на www лежит очень много контента, может не всегда качественного, но все же, а поисковика по файлам нормального просто нет. Может я не просвящен и он уже давно есть, хотел бы послушать мнения.

ИМХО.

Для софта есть соответствующие сайты, для игр тоже и т.д.

ФТП чем прекрасен, что там файлы называют так, чтобы понятно было что качаешь, а на хттп все выкладвают как могут.

Много файлов в инете типа: setup.exe и т.д.

А файлы можно искать и через яндекс, главное задать расширение: (4)TerenasStand.w3x

МИР ТРУД СЧАСТЬЕ РАВЕНСТВО БРАТСТВО (с)
vano
На сайте с 12.02.2006
Offline
127
#2

Rambler поиск файлов, вроде нормально ищет

A
На сайте с 08.06.2006
Offline
5
#3

Есть способы индексировать EXE файлы с их названиеми.

А если надо найти видео, мп3, текст, PDF или DOC файл, на фтп линки быстро умирают, быстрее чем на www и на http контента гораздо больше в открытом виде. А как искать файлы на поисковиках никто не знает разве что юзеры сеченджин.ру

A
На сайте с 08.06.2006
Offline
5
#4
vano:
Rambler поиск файлов, вроде нормально ищет

ее мало кто использует попробуй набери tatu или tatoo выбери аудио, и все станет ясно ни одной песни он не найдет :)

A
На сайте с 08.06.2006
Offline
5
#5

Хочется услышать мнение специалистов, а не то что можно искать на рамблере, это все FTP поиск я говорю про HTTP поиск. Даже существующие сервисы не могут предоставить полный поисковой сервис по всем видам файлам.

E
На сайте с 27.08.2005
Offline
15
#6

Я, честно говоря, не совсем пойму, в чем вы видите проблему? Задача поиска по файлам достаточно тривиальна: индексируете название, индексируете текст входящих ссылок (возможно, включая некоторую дельта-окрестность), всю текстовую информацию внутри файла (например pdf - это тоже бинарные данные, но есть конвертеры в текст; очень часто в бинарных файлах есть различная метаинформация: например, id3 тэг в mp3), можно попробовать индексировать слова, входящие в путь к файлу.

При поиске давать позможность фильтрации по типу (лучше здесь использовать content-type, хотя не всегда надежный способ; как альтернатива - по расширению, но опять-таки нет гарантии, что расширение соответствует содержанию)

[Удален]
#7

adamrich, есть такая вещь, шареаза, к примеру :)

lagif
На сайте с 15.12.2004
Offline
30
#8

Я думаю, при том развитии пиринговых сетей, какое сейчас, файловый поиск становится непопулярным.

Хотя, конечно, если сделать узконаправленный поиск... допустим, чтение mp3 - заголовков вместе с битрейтом (меня убивает, когда нахожу файлы с низким битрейтом)...

А может, я не с той стороны смотрю?...

Это тоже пройдет...
A
На сайте с 08.06.2006
Offline
5
#9
Eugen:
Я, честно говоря, не совсем пойму, в чем вы видите проблему? Задача поиска по файлам достаточно тривиальна: индексируете название, индексируете текст входящих ссылок (возможно, включая некоторую дельта-окрестность), всю текстовую информацию внутри файла (например pdf - это тоже бинарные данные, но есть конвертеры в текст; очень часто в бинарных файлах есть различная метаинформация: например, id3 тэг в mp3), можно попробовать индексировать слова, входящие в путь к файлу.

При поиске давать позможность фильтрации по типу (лучше здесь использовать content-type, хотя не всегда надежный способ; как альтернатива - по расширению, но опять-таки нет гарантии, что расширение соответствует содержанию)

Все верно, видите вы даже идеи подкидываете как можно индексировать. Согласитесь что такого поисковика просто нет и пиринг сети это тоже не то они выдают только по названию файла + даже то что нашел не всегда можно скачать.

И вопрос стоял так, нужна ли такая поисковая система и будет ли она пользоваться популярностью? :) Реально ли сделать посещаемость хотябы 50К в день если она будет качественно искать любые файлы + гарантия 99% что файл можно скачать (будет чекер каждый день проверять линки если бед то не выводить в результатах). У меня просто есть возможность финансировать этот проект вот и интересуюсь мнением других.

A
На сайте с 08.06.2006
Offline
5
#10
lagif:
Я думаю, при том развитии пиринговых сетей, какое сейчас, файловый поиск становится непопулярным.
Хотя, конечно, если сделать узконаправленный поиск... допустим, чтение mp3 - заголовков вместе с битрейтом (меня убивает, когда нахожу файлы с низким битрейтом)...

А может, я не с той стороны смотрю?...

Вот как раз это и будет все, вам интересны Мп3 другому текстовые файлы, теже тексты песен например, кому то программы. А пиринговые сети да согласен инструмент хороший но не всегда дает скачать то что надо.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий