Яндекс вырос до 778 компактов

123 4
F
На сайте с 15.11.2000
Offline
116
4186

Яндекс недавно превысил рубеж в 500Гб проиндексированной информации, что по объему примерно эквивалентно 778 компактам. Поздравляю от всей души и желаю первыми прийти перелопатить 1 терабайт!

К сравнению, Апорт справился только с 234Мб информации.

Сколько проиндексировал Рамблер достоверно не известно, но, на мой взгляд, он еще вдвое отстает от Апорта.

С уважением,

Александр Садовский.

[This message has been edited by funsad (edited 06-04-2001).]

Ashmanov
На сайте с 21.11.2000
Offline
66
#1

<font face="Verdana" size="2">Originally posted by funsad:


К сравнению, Апорт справился только с 234Мб информации.

Сколько проиндексировал Рамблер достоверно не известно, но, на мой взгляд, он еще вдвое отстает от Апорта.
</font>

Опять возникает дискуссия. подобная заключение о том что если Спайлог показывает то-то, то это прямо означает качество поисковиков. Не означает, как мы уже выяснили здесь же. А сейчас вы вообще делаете то же самое на основе информации, записанной, как говорит мой знакомый врач, "со слов больного".

Вот простой вопрос - что именно подсчитывают на этих страницах А и Я - просто чистый текст или HTML? Там не сказано.

Второй, не менее простой вопрос - дубли учитываются или нет? Известно, что в Яндексе 100% дубли имеются в количестве. Значит, "уникальные" документы считаются по отличию URL? Или нет?

А в Апорте?

Третий вопрос - склеиваются ли при подсчёте разные кодировки одного и того же документа?

Неочевидно!

От ответа на эти вопросы сильно зависит способ и результатыт подсчёта. Различные толкования могут дать разницу не в два, а и в три-четыре раза.

Например, если какой-то технический парень в Апорте от излишней скрупулёзности дубли или КОИ-8 выкинул из подсчёта, то и получился негативный маркетинговый эффект для компании, как видим.

Если же хочется профессионально тестировать поисковики на полноту - третье главное свойство после релевантности и функциональности, нужны специальные методики (подбор характеристических запросов и так далее). Могу как-нибудь подготовить и прислать, если интересно. Но это не быстро.

Игорь.

С уважением, Игорь Ашманов Все для оптимизации (рассылка, сервисы): www.optimization.ru (www.optimization.ru) Сервис по созданию собственных поисковиков: www.flexum.ru (www.flexum.ru)
Ashmanov
На сайте с 21.11.2000
Offline
66
#2

<font face="Verdana" size="2">


</font>

Эй, модератор форума:

А по Вашим правилам логотипы здесь можно вставлять? Странно как-то.

Я на всякий случай восстановил справедливость в отношении Апорта.

А вообще, конечно, интереснее вставлять фото красивых неодетых девушек или карточки товаров с ценами.

Игорь.

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#3

Строго говоря, вставляются картинки с использованием UBB code. Мне как-то безразлично, вставляются они или нет, т.к. картинки хранятся не у меня на сервере, т.е. не едят мой траффик.

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#4

Правда, естественно, что неуместные картинки вставлять не стоит

F
На сайте с 15.11.2000
Offline
116
#5

<font face="Verdana" size="2">Originally posted by Ashmanov:
Если же хочется профессионально тестировать поисковики на полноту - третье главное свойство после релевантности и функциональности, нужны специальные методики (подбор характеристических запросов и так далее). Могу как-нибудь подготовить и прислать, если интересно. Но это не быстро.</font>

Игорь, спасибо за участие в форуме. По тону Вашего отзыва видно, что Вас задело немного негативное упоминание поисковика Рамблера. Это моя вина, я не пытался кого-то уязвить, я просто опирался на числа, открытые для всех поисковиками. Однако то, что при этом раскрытые числа ни один из поисковиков не постарался объяснить, в минус только тем, кто их писал. На Рамблере цифру объема базы в Гб я просто не нашел -- максимум, что встретил, это число проиндексированных документов в пресс-релизе (то есть заведомо устаревшая информация). И ни одним словом я не пытался сказать, что какой-то из поисковиков лучше.

Все, что мне хочется, чтобы после данного обсуждения в Рамблере появилась страничка, на которой не только приводятся числа, как в Апорте и Яндексе, но и разъясняется, как получены данные числа, и дается ссылка на методики тестирования полноты базы. Такой профессиональный подход был бы только в плюс Рамблеру. Так ведь?

Я, и другие участники форума с удовольствием прочтем и постараемся применить методику для оценки объема базы. Вы сможете прислать ее не быстро? Мы обождем. Заранее спасибо.

С уважением,

Александр Садовский.

I
На сайте с 15.12.2000
Offline
80
#6

Да ладно, чего там. Дело нехитрое.

Берем N редких слов (чтобы было легко проверить весь результат).

Делаем запросы - очень удобно из нашего Я-Бара, там все перечисленные

товарищи фигурируют. Перед этим надо еще залезть в настройки альтависты,

фаста и гугля, ну да это вы и сами знаете.

Вот и результат. Не знаю, влезет или нет, я таблички

в UBB писать не умею.


Yandex Rambler Google Aport Fast
перверсия 1032 229 22% 202 20% 584 57% 204 20%
квадруполь 158 41 26% 35 22% 38 24% 35 22%
спелеометрия 4 1 25% 0 0% 3 75% 0 0%
компрачикос 116 38 33% 7 6% 98 84% 22 19%
внеиндивид-ый 86 16 19% 10 12% 4 5% 9 10%
контроверсия 70 41 59% 9 13% 17 24% 7 10%
бладшот 9 1 11% 3 33% 9 100% 0 0%
пармизан 14 1 7% 2 14% 2 14% 3 21%
абхидхарма 415 112 27% 150 36% 178 43% 181 44%
паринирвана 143 50 35% 25 17% 21 15% 25 17%
резольвент 453 224 49% 42 9% 356 79% 28 6%
сантистокс 64 17 27% 26 41% 17 27% 35 55%
сигарилла 1139 57 5% 16 1% 211 19% 15 1%
бриолин 430 111 26% 165 38% 218 51% 101 23%
вишнуизм 187 59 32% 91 49% 109 58% 72 39%
аргонавтика 407 209 51% 135 33% 310 76% 136 33%
бхакти 1826 527 29% 2330 128% 1372 75% 1478 81%
анахоретство 21 11 52% 13 62% 7 33% 6 29%
иподьякон 139 53 38% 47 34% 125 90% 33 24%
виверра 154 41 27% 51 33% 101 66% 83 54%
цивета 67 9 13% 18 27% 11 16% 19 28%
брахиозавр 119 30 25% 70 59% 107 90% 58 49%
неликвидность 463 261 56% 89 19% 169 37% 140 30%
инклинометр 261 81 31% 36 14% 161 62% 47 18%
базед 44 13 30% 26 59% 17 39% 49 111%
------------ --- --- --- ---
В среднем 30% 31% 50% 30%

Результаты хорошо согласуются с официальной статистикой Апорта и Яндекса.

Еще нюанс - мерил это примерно месяц назад

Конечно же, слова я долго и тщательно подбирал, чтобы принизить конкурентов,

а не просто залез в энциклопедию и выдрал оттуда первые попавшиеся.

Удачи, Илья

AiK
На сайте с 27.10.2000
Offline
257
AiK
#7

Илья, Ваши цифры ровным счётом ничего не доказывают! (Или это такая своеобразная проверка на вшивость членов форума? ).

На моём форуме была любопытная описка - вместо SoftIce посетитель написал SiftIce. Уверяю Вас, он сделал это ровно один раз. А вот Яндекс показывает 14 документов и 15 вхождений этого слова. Но документ-то по сути один!

С уважением,

Артём.

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#8

Илья, как я понимаю, Альтависта все же оказалась на высоте и ее постигла участь "несдавшегося врага". Случаем, не в этих целях появились заголовки "Hasta la vista Altavista"?

Это я к тому, что ее-то как раз в иаблице нет...

I
На сайте с 15.12.2000
Offline
80
#9

<font face="Verdana" size="2">Originally posted by Gray:
Илья, как я понимаю, Альтависта все же оказалась на высоте и ее постигла участь "несдавшегося врага". Случаем, не в этих целях появились заголовки "Hasta la vista Altavista"?

Это я к тому, что ее-то как раз в иаблице нет...
</font>

Ну зачем же так, я всех одинаково люблю, честное слово

Я просто боялся, что не влезет, и, к тому же, у АльтаВисты - похуже результаты. Да, господи, проверять-то ну никак не больше 10 минут

Илья

AiK
На сайте с 27.10.2000
Offline
257
AiK
#10

-Доктор, меня игнорируют

-Следующий

© Бородатый анекдот

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий