8Racer

Рейтинг
3
Регистрация
28.07.2008
Интересы
НС, ГА

ха-ха)) система ранжирования пока не разработана)))) php+мускуль - тоже жжёшь))

Мой вам совет - бросайте это дело и как можно быстрее. Не тратьте своё время на работу, которая заведомо не будет выполнена хорошо.

Если проиндексировать web, условно, "каждый дурак" может, это задача разрешимая, то релевантно расположить результаты - задача в разы сложнее, это и есть основной критерий качества поисковика.

Ну а уж про бизнесс-модель и нечего говорить. Почитайте побольше, начните с roem.ru, может дальше уже читать расхочется))

Спасибо! :)

Только я не очень понял, что значит "ключи для запросов"? Через что организован процесс запроса к Google? Эх, ссылочку бы...))))) [совсем наглею]

ммм... не знаю, на хабре я не нашёл, а узнал я про этот сайт, т.к. являюсь подписчиком в группах Google их проекта Google-Labs-Sets (http://groups.google.com/group/google-labs-sets/browse_thread/thread/d52ae8f3a72553a2?hl=en), там и был пост про feedity.

Кстати, советую подписаться на RSS вот этого сайта: http://www.hasthelhcdestroyedtheearth.com
Читаю комменты в HTML коде странички: "the first person to ask for an RSS feed gets a free black hole in their junk" :-) :-) :-)

Ладно, кроме шуток, хочу спросить:

1. А русские QA не подскажите? ;-) Желательно, с web-интерфейсом...

2. И ещё вопрос: как вам удаётся парсить Google в своём этом кластеризующем поисковике newisearch? Я имею в виду с точки зрения бана по IP - при привышении кол-ва запросов (условно, 1000 в день). Proxy? Вроде бы нет, работает довольно быстро... Ведь там явно не пользовательский поиск стоит...

ИМХО, утка.

Советую обратить внимание на START от MIT:

http://start.csail.mit.edu/

Это тоже QA система, открытая ещё в 1998 году (а в сети с 2001). В силу большого кол-ва запросов, заданных системе, её НС уже работает корректно более чем в 70% случаев, причём с уточнением области поиска:

1. Для контента создается краткая аннотация

2. Запрос клиента анализируется на схожесть с аннотацией

3. Наиболее "подходящий" контент возвращается как результат

Хоть она работает на порядок быстрее вашей и имеет on-line интерфейс, но она имеет существенный недостаток... она не на РУССКОМ! Рад, что теперь, хоть и в зачаточном состоянии, появилась (не считая закрытых лабораторий поисковиков) русскоязычная QA система и, возможно, она будет open-source? ;)

з.ы.
почитал ваш сайт, возможно будет интересно (по поводу RSS):
http://feedity.com/

Есть уже такой поисковик: http://tineye.com

Чем вам семантический анализ не нравится? Сейчас уже есть достаточно много open-source алгоритмов, поищите.

---

http://www.ashmanov.com/tech/semantic/demo/

Эх, все свои секреты раздаю...

http://www.rco.ru/

http://neurok.ru/

А по-хорошему, свою НС надо писать...

О, эт хорошо! Когда я регился с полгода назад - неделю ждал. Глядишь, так и в свободном доступе скоро начнут работать 🚬

Да, есть такой: http://tineye.com/.

Но доступ пока только по приглашениям. Однако, можно зарегистрироваться и Вас поместят в waiting-list заявок. Если надо, могу выслать приглашение (3 человека).

Ещё кидаю ссылку на промо-ролик. В YouTube его почему-то нет...

Порадовало сравнение: TinEye does for images what Google does for text. Give it an image, and it shows you where else that image appears on the web.

12
Всего: 13