Первый терабайт. Да здравствует Яндекс!

123
[Удален]
#11

В Яндексе пишут, что этот пресловутый рубеж они перешли 5 марта.

И тут же (только что заметил):

Рост Интернета с 24 февраля по 03 марта: -8.54%

Пир во время чумы

Алексей

I
На сайте с 15.12.2000
Offline
80
#12

Вячеслав, а Вы знаете примеры _работающей_ технологии, подобной описанной Вами? Не поделитесь ссылкой?

С уважением,

Илья

VT
На сайте с 27.01.2001
Offline
130
#13

Originally posted by iseg:
Вячеслав, а Вы знаете примеры _работающей_ технологии, подобной описанной Вами? Не поделитесь ссылкой?

С уважением,
Илья

http://vivisimo.com ,например

I
На сайте с 15.12.2000
Offline
80
#14

То есть вы хотите сказать, что vivisimo часть запросов шлет на альтависту, а часть на fast?

Такого эффекта не наблюдал

VT
На сайте с 27.01.2001
Offline
130
#15

Originally posted by iseg:
То есть вы хотите сказать, что vivisimo часть запросов шлет на альтависту, а часть на fast?

Такого эффекта не наблюдал

Ну Вы же просили ссылку на ПОДОБНУЮ технологию.

Или технология vivisimo собирает кластера недостаточно хорошо, чтобы можно было организовать маршрутизацию запросов?

I
На сайте с 15.12.2000
Offline
80
#16

Originally posted by Vyacheslav Tikhonov: тут же получил ошибку 403, после чего вопросы просто "отстреляли". Честно говоря не понял за что, видимо, за прошлые "заслуги".

Мы на Вас никаих обид не держим, честно говоря. Да и вообще, Яндекс не практикует отсечение конкретных пользователей от форумов. В принципе. Это противоречит нашей политике.

В какой-то момент при завершении форума, то есть при закрытии его на запись, он очень недолго выдавал 403. Почти сразу же после этого был открыт архив форума. Эффект был заметен буквально несколько минут.

Илья

[This message has been edited by iseg (edited 13-03-2002).]

I
На сайте с 15.12.2000
Offline
80
#17

Я все-таки не понял о каких компонентах метапоисковой технологии из вашего письма

рассчитывают центроиды и по-научному собирают коллекции похожих документов, после чего отправляют запросы в нужные коллекции

идет речь в случае с vivsimo? Где можно почитать о реализации метапоиска в vivsimo?

С уважением,

Илья

VT
На сайте с 27.01.2001
Offline
130
#18

Originally posted by iseg:
Я все-таки не понял о каких компонентах метапоисковой технологии из вашего письма

идет речь в случае с vivsimo? Где можно почитать о реализации метапоиска в vivsimo?

С уважением,
Илья

vivisimo я привел как пример удачной системы кластеризации. Как они умудряются на ходу собирать эти кластеры, с центроидами или без, неизвестно, да и не суть важно. Не важно даже, кластеры собираются на полнотекстовом поиске или метапоиске.

Насколько я понимаю, с кластерной технологией можно не только организовать query routing, но и отслеживать самые обновляющиеся документы внутри одной СТРУКТУРИРОВАННОЙ коллекции и тем самым эффективно эту коллекцию обновлять. Кроме этого, похоже, можно неплохо отслеживать "похожие" документы, которые будут лежать рядом.

Видимо, сейчас в Яндексе из семантики максимум используется смартовская "функция косинуса" для нахождения похожих документов?

wolf
На сайте с 13.03.2001
Offline
1183
#19

Однако, похоже Яндекс отступил назад за терабайтную отметку:

Сейчас Яндекс заявляет

следующее:


Рунет сегодня
Количество уникальных серверов: 480 875
Количество уникальных документов: 58 703 769
Объем проиндексированной информации: 957,61 Гб

Интересно, в чем дело:

а) Глюк?

б) Объем Рунета действительно уменьшился?

в) Яндекс активно чистит базу, пополняя бан-лист?

г) А может, терабайта-то и не было? ;)

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
I
На сайте с 15.12.2000
Offline
80
#20

Агрессивная чистка похожих (до 7% отличий) документов. Не волнуйтесь - мы быстро вырастем.

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий