Новый поисковик, однако!

L
На сайте с 20.04.2005
Offline
1
#111

spark, честно говоря, не вижу в этом ничего плохого. кластер, который вы мне присалли, с моей точки зрения -- релевантный, сайты в нем -- релевантные (запросу), название -- ну не из пальца ж его высасывать?

spark
На сайте с 24.01.2001
Offline
130
#112

Ну, пацаны, тут нам карта и повалила :)

VT
На сайте с 27.01.2001
Offline
130
#113
Ну, пацаны, тут нам карта и повалила

Ну так - ВМиК, лаборатория 704. :) Самая умная поисковая система, все-таки.

L
На сайте с 20.04.2005
Offline
1
#114

ну хорош измываться -- мы тут ночами не спим, работаем для вас, блин :-) багу с дефисом, кстати, пофиксили вроде -- если будет проявляться -- жалуйтесь, пожалуйста.

SS
На сайте с 03.09.2004
Offline
141
#115

lavrenko, хотелось бы получить некоторые комментарии к новости /ru/news/5303

Во-первых, расскажите, плз, подробнее, какими методами Вы пользовались, когда склеивали страницы?

Вы, ведь, буквально недавно говорили, что не можете это сделать , . Потом утверждали, что на скачивание и распарсивание 24 млн страниц, по Вашим словам, должен уйти как минимум год . Если все это дело еще и заставить проверяться друг с другом на похожесть, то время, соответственно, выростет по экспоненте, а Вы все "сделали" примерно за 10 дней миллиард с чем-то страниц, причем не имея "крутых" аппаратных ресурсов ( , ). Круто, однако, но не верится.

Теперь второе - Ваша система - метапоисковик, которая зависит от поиска остальных систем как игрек от икса. Объясните, плз, как вы смогли рассчитать количество непроиндексированных документов, если вы даже о проиндексированных немного знаете. (ибо в цифру 1'052'227'229 почему-то не верится)

«Клянусь своей жизнью и любовью к ней, что никогда не буду жить ради другого человека и никогда не попрошу и не заставлю другого человека жить ради меня» (с) Джон Галт
L
На сайте с 20.04.2005
Offline
1
#116
какими методами Вы пользовались

мы -- научный проект, и мы можем себе позволить говорить все, что угодно. но вот поисковые системы, которые мы используем -- коммерческие, и если мы, например, опубликуем делали алгоритма (вместе с исходниками, вместе с базой запросов, на которой мы проводили тестирование), это может серьезно помешать этим поисковикам заниматься бизнесом. а мы наоборот -- хотим помочь (см. последний абзац новости на сайте). поэтому я предпочту пока не отвечать на эти вопросы, дождавшись реакции коммерческих поисковиков (если таковая будет).

SS
На сайте с 03.09.2004
Offline
141
#117
мы можем себе позволить говорить все, что угодно

Вот именно поэтому я и задал вопросы, потому как не поверил Вам.

вместе с исходниками

Вы так говорите, будто Google, Yahoo, MSN, Yandex и Rambler открыли перед Вами исходники своих поисковых систем.

я предпочту пока не отвечать на эти вопросы (если таковая будет).

Хорошо, Ваше право.

Только не забудьте о вопросах.

L
На сайте с 20.04.2005
Offline
1
#118
Только не забудьте о вопросах

ок, вроде все кто хотел -- среагировали. фактически, наши результаты они подтвердили, так что алгоритм был, видимо, верный. а все документы мы, разумеется, не закачивали -- зачем? мы ж написали, каким методом мы пользовались.

SS
На сайте с 03.09.2004
Offline
141
#119
мы ж написали, каким методом мы пользовались

Идея понятна.

L
На сайте с 20.04.2005
Offline
1
#120
Идея понятна

ну все, вы теперь согласны, что мы никого не обманывали? :-)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий