Новый нейротопик

AESCBC192
На сайте с 11.06.2016
Offline
51
#121
Lastwarrior:
У Гугла по всему свету разбросаны десятки тысяч самых современных серверов и это не считая железа под Ютуб, поэтому места у него более чем достаточно, чтобы хранить данные еще на 10 лет вперед.

Очень похоже что так и есть.

Нужно посчитать примерное количество страниц в сети в пересчете на терабайты дискового пространства, тогда можно будет понять на каком уровне какие фильтры работают.

---------- Добавлено 27.01.2017 в 09:42 ----------

Nickolay365:
страницы может быть n ревизий, так как гугл бот может скачать страницу n раз

Дифы хранить может, скорее всего так и есть, страница и по ней архив с дифами по датам.

---------- Добавлено 27.01.2017 в 09:49 ----------

Nickolay365:
какой смысл тратить на него место на ssd

таймменеджмент, на таких количествах поисковых запросов, хранить на сриммерах означает понизить наработку на отказ всей системы, а ревизии и перезапуски на таких масштабах обходятся дороже чем хранение даже на RAID SSD, на энтерпрайзе это очень сильно снизит экономический эффект всего решения, фактически он станет отрицательным.

Стриммеры тоже могут быть, в качестве бэкап-системы, но хранить на них страницы нецелесообразно, скорее логи.


большая ёмкость;
низкая стоимость и широкие условия хранения информационного носителя;
стабильность работы;
надёжность;
низкое энергопотребление у ленточной библиотеки большого объёма.
Однако, четыре из протестированных SSD вышли из строя до достижения рубежа в 1 петабайт записанной информации или сразу после него.

Очень похоже что долговременные бэкап-хранилища таки на стримерах, так что версия вполне правдоподобна.

UPD Если добавить систему прогнозирования времени запросов на нейронке, подключить прогнозирующий AI тем самым скоменсировав относительно низкую скорость доступа - можно даже весь архив харнить на стримерах, с перегрузкой в прокси на SSD перед ожидаемым запросом, с учетом надежности последних - скорее всего крупные хранилища работают именно на таком принципе.

UPD Но наиболее вероятно они на данный момент хранят данные в кубитах (q-bit) и используют квантовые вычислителньые системы для обработки запросов, такие системы уже появлись в продаже, соответствено у них они появились раньше, потому как обеспечить скоростно доступ и прогнозирование запросов на объемах в петабайты и при этом обеспечить ту скорость с которой Google отображаетет выдачу малореалистично.

Новость по теме: ... Так же на основе этой же системы искусственного интеллекта специалисты компании Google собираются создать новые квантовые алгоритмы высокоэффективной поисковой системы

_Snake_
На сайте с 06.12.2010
Offline
151
#122
Nickolay365:
хранить их совсем необязательно. как делает гугл - не знаю

Так может не гадать? Может в выдаче есть ответ? :)

---------- Добавлено 27.01.2017 в 12:13 ----------

Nickolay365:
у каждой страницы может быть n ревизий

Нет, им это и не нужно. Они занимаются поиском актуальной информации, а не хранением архивов кто, когда, что писал.

[Удален]
#123
_Snake_:
Так может не гадать? Может в выдаче есть ответ? :)

не знаю. как это понять?

_Snake_
На сайте с 06.12.2010
Offline
151
#124
Nickolay365:
не знаю. как это понять?

[Удален]
#125
_Snake_:

это понятно. предыдущие ревизии как можно посмотреть?

_Snake_
На сайте с 06.12.2010
Offline
151
#126
Nickolay365:
это понятно. предыдущие ревизии как можно посмотреть?

А для каких целей они нужна ПС?

T
На сайте с 15.11.2011
Offline
120
#127

если бы гугл хранил все сайты, которые когда-либо сканил его бот, он бы просто охренел...

думаю, именно по этому дор, вылетевший из серпа, залетает обратно, если ему просто сменить урл.

если страница уже не актуальна для выдачи - зачем ее хранить?

Дешевые VDS - Дешевле некуда! (http://0ll0.ru/4Ta9y)
[Удален]
#128
Tecak:
если бы гугл хранил все сайты, которые когда-либо сканил его бот, он бы просто охренел...
думаю, именно по этому дор, вылетевший из серпа, залетает обратно, если ему просто сменить урл.
если страница уже не актуальна для выдачи - зачем ее хранить?

у гугла могут быть разные задачи. для некоторых из них могут быть актуальны разные версии страниц

_Snake_
На сайте с 06.12.2010
Offline
151
#129
Nickolay365:
у гугла могут быть разные задачи. для некоторых из них могут быть актуальны разные версии страниц

Назови хоть одну?

[Удален]
#130
_Snake_:
Назови хоть одну?

например, такая же для которой нужно записывать и хранить телефонные звонки

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий