SearchInform Internet Server

123
L
На сайте с 02.05.2004
Offline
35
#11
itman:
Не очень понял насчет тестирования скорости: 5000 тысяч запросов выполнялись в общей сложности 45 минут, или 45 минут выполнялось 5000 * 40 тысяч запросов?

5000 запросов в общей сложности по очень большой базе около 5 млн страниц и если пересчитывать на Инет то около терра данных.

С каждого из 4 компов отправлялось по 1250 запросов соответстенно в 10 потоках. То есть на сервер все время шло порядка 40 запросов.

Leo www.searchinform.ru (www.searchinform.ru)
M
На сайте с 29.03.2003
Offline
65
#12
Leom:

Maxime -- если я верно угадал вы не занимаетесь коммерцией, иначе бы паром вы это не считали.......

Теперь для чего я сюда запостил. Чтобы коллеги которые изъявят желание потестить и покритиковать (не абстрактно а после тестировки) начали это делать :)

Что-то мне подсказывает, что предложение бесплатно потестить что-то в TREC - это именно пеар, причём дешевого пошиба, бо собеседник мало представляет что это такое...

Проверь свои запросы: Вершки Рунета (http://www.43n39e.ru/)
L
На сайте с 02.05.2004
Offline
35
#13
Maxime:
Что-то мне подсказывает, что предложение бесплатно потестить что-то в TREC - это именно пеар, причём дешевого пошиба, бо собеседник мало представляет что это такое...

Maxime а вы чем занимаетесь? У Вас есть какой то бизнес или вы просто порассуждать о жизни?

Как раз если бы я не представлял что такое TREC и не понимал что для этого надо усилия программистов котороым и так есть чем заняться, то и не предлагал бы вам потестить -- как я понимаю из чистого научного интереса. Коммерческого интереса я просто уверен у вас нет.

I
На сайте с 26.05.2001
Offline
64
#14

Нет, я понял по поводу объема базы данных. Средняя страница в 20 Кб, что примерно 3-4 средних HTML странички. То бишь, аналог в 15-20 млн страниц веба. И в среднем чуть меньше секунды на каждый запрос. А что была за железка?

Leom:
5000 запросов в общей сложности по очень большой базе около 5 млн страниц и если пересчитывать на Инет то около терра данных.

С каждого из 4 компов отправлялось по 1250 запросов соответстенно в 10 потоках. То есть на сервер все время шло порядка 40 запросов.
Приходите завтра, завтра будет! (http://itman666.livejournal.com)
M
На сайте с 29.03.2003
Offline
65
#15
Leom:

Как раз если бы я не представлял что такое TREC и не понимал что для этого надо усилия программистов котороым и так есть чем заняться, то и не предлагал бы вам потестить -- как я понимаю из чистого научного интереса. Коммерческого интереса я просто уверен у вас нет.

Leom, скажите, пожалуйста, а от чего вы вами же поднятый вопрос тестирования вашего же поисковика столь упорно сводите к моему коммерческому интересу ? Можно это рассматривать как подсознательное желание таки уйти от больного вопроса релевантности ? :)

L
На сайте с 02.05.2004
Offline
35
#16
itman:
Нет, я понял по поводу объема базы данных. Средняя страница в 20 Кб, что примерно 3-4 средних HTML странички. То бишь, аналог в 15-20 млн страниц веба. И в среднем чуть меньше секунды на каждый запрос. А что была за железка?

Amd 3.2 винт обычный sata памяти 4 гига

Сетка гигабитная между всеми 5 компами.

L3
На сайте с 01.03.2007
Offline
1
#17

Че то действительно не понятно ... вроде и протестить предлагаешь, и причем именно на этом сайте .... а в конечном итоге получается... что протестить то только можно тем кто имеет коммерческий смысл ...

Мне так кажется... что раз сюда написал, так и тестить надо давать не тем у кто с коммерческим смыслом интересуеется, а имеено тем кто интересуется с научной точки зрения... что за алгоритм придумали... чем он отличается... на чем написали.... и т.д. А уже потом люди протестившие его с научной точки зрения... твой продукт скажут ... полезен он или нет...

L
На сайте с 02.05.2004
Offline
35
#18
l4ngl3y:
Че то действительно не понятно ... вроде и протестить предлагаешь, и причем именно на этом сайте .... а в конечном итоге получается... что протестить то только можно тем кто имеет коммерческий смысл ...
Мне так кажется... что раз сюда написал, так и тестить надо давать не тем у кто с коммерческим смыслом интересуеется, а имеено тем кто интересуется с научной точки зрения... что за алгоритм придумали... чем он отличается... на чем написали.... и т.д. А уже потом люди протестившие его с научной точки зрения... твой продукт скажут ... полезен он или нет...

Алгоритмы никто никому рассказывать не будем. А протестить -- велкам -- более того поможем установить на ваш выделенный сервак на хостинг площадке.

Требования к серваку :

- не менее 2 гиг памяти

- windows

L3
На сайте с 01.03.2007
Offline
1
#19

Никто не просит приводить мат. модель алгоритмов, можно же его описать в общем, в чем его отличее от других ... есть ли вообще ранжирование.... и кто му же, если в алгоритмах релевантности ничего нового нет, что же мешает тебе тогда его здесь описать... И с твоих

слов, как я понимаю следует, что у большенства поисковых систем одинаковые алгоритмы релевантности ?? :)

Именно поэтому вы и реализовали:

"2) Релевантность. Она у всех примерно одинакова и тут просто нечего выпячивать. В алгоритмах релевантности ( не путать с алгоритмами борьбы с поисковым спамом) ничего нового нет и выпячивать то что у всех примерно на таком же уровне смысла нет
Хотя если вы хотите потестить нашу релевантность -- велкам и плиз с публикацией результатов. Считаете что от компании СофтИнформ официальное разрешение на тестировку получили.
"

И как следует из твоих слов, вы не проводили тестирование на релевантность поиска ???

Вы просто добились "быстрой индексации данных" ???

Скорость как, было написанно выше Maxime, не является основным кретерием ПС...

L
На сайте с 02.05.2004
Offline
35
#20
l4ngl3y:
Никто не просит приводить мат. модель алгоритмов, можно же его описать в общем, в чем его отличее от других ... есть ли вообще ранжирование.... и кто му же, если в алгоритмах релевантности ничего нового нет, что же мешает тебе тогда его здесь описать...
...

Время которое стоит достаточно дорого....... Я же сказал что я занимаюсь не наукой а бизнесом. И если хочешь потестить -- велкам -- тебе дадут ключ и т.д. А потом вот в форуме и опишешь с научной точки зрения. Слабо?

А просто базарить -- сорри времени нет. Тем более я уверен что тестить ты не будешь -- так как те кто хотел уже начали тестить а не базарить, то есть своим постом я цели достиг.

l4ngl3y:

И как следует из твоих слов, вы не проводили тестирование на релевантность поиска ???
Вы просто добились "быстрой индексации данных" ???

Скорость как, было написанно выше Maxime, не является основным кретерием ПС...

Ага мы вообще рандомом выдаем результат :) Какой ответ такой и вопрос.

Кстати а с Maxime вы не близнецы-братья? Просто у вас обоих большая любовь к букве "E". Типа

- пеар

- кретерий

Или сие новое слово в науке? :)

Ладно все уважаемый -- будет желание тестить пиши -- я же далее на посты про кретерии и пеар но без конкретики отвечать не буду :)

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий