Новый нейротопик

AESCBC192
На сайте с 11.06.2016
Offline
51
#111
Nickolay365:
я то для генерации могу себе железа прикупить. а вот гугл вряд ли, чтобы каждую страницу проверять

ты видел нейронную сеть в свертке? она не потребляет много мощности, Google может использовать свой язык или вставки в коде на ассемблере, скоростные SSD, процессоры с расширеным кэшем, у них доступ к последним технологиям, думаю вопросов с мощностями у них не возникает.

[Удален]
#112
AESCBC192:
ты видел нейронную сеть в свертке? она не потребляет много мощности, Google может использовать свой язык или вставки в коде на ассемблере, скоростные SSD, процессоры с расширеным кэшем, у них доступ к последним технологиям, думаю вопросов с мощностями у них не возникает.

ну да, это бы улучшило качество поиска на ноль целых хрен десятых процента при значительных вложениях. если бы каждый 2-й стал что-то генерить, тогда бы имело смысл вкладываться. плюс гугл - большой программный продукт. работает, прибыль приносит владельцам, смысла что-то серьезно менять нет

AESCBC192
На сайте с 11.06.2016
Offline
51
#113

Смысл экономический, зачем хранить на вминчестерах тонны бесполезного мусора если можно один раз вложиться в оптимизацию фильтров.

_Snake_
На сайте с 06.12.2010
Offline
151
#114
AESCBC192:
текст будет забанен при первом проходе бота, снабежнного данным фильтром
AESCBC192:
а это ранжирующий от по результату его обхода назначается поисковая позиция
AESCBC192:

бан после прихода бота со сталистическим фильтром (разновидность частотного по морфологии и вхождениям)

Вот за, что люблю сёрч, так это за, то что каждый теоретик придумывает новые легенды...

Спустя какое-то время адепты дислексии будут всерьёз обсуждать:

- Ранжирующего бота

- Бота со статическим фильтром

- Бота с частотным фильтром

- Бота выдающего бан 🤪

[Удален]
#115
AESCBC192:
Смысл экономический, зачем хранить на вминчестерах тонны бесполезного мусора если можно один раз вложиться в оптимизацию фильтров.

текст хорошо сжимается. копии всех скачанных страниц, полагаю, гугл все равно хранит хотя бы на всякий случай. для этого не нужны быстрые винчестеры. можно хоть на магнитной ленте, так как доступ к архиву, если и будет, то крайне эпизодическим

_Snake_
На сайте с 06.12.2010
Offline
151
#116
Nickolay365:
текст хорошо сжимается. копии всех скачанных страниц, полагаю, гугл все равно хранит хотя бы на всякий случай.

Николай, ты вроде адекватный в отличии от ТС, подумай, можно ли со 100% точностью ответить на вопрос хранит гугл страницы или нет? 🍿

realefs
На сайте с 27.06.2010
Offline
87
#117
_Snake_:
Николай, ты вроде адекватный в отличии от ТС, подумай, можно ли со 100% точностью ответить на вопрос хранит гугл страницы или нет? 🍿

146% хранит. причем используют обычные десктопные решения, а не серверные. т.к. это обходится дешевле, при приемлемом уровне брака/потерь.

Рубероид дорожает.
[Удален]
#118
_Snake_:
Николай, ты вроде адекватный в отличии от ТС, подумай, можно ли со 100% точностью ответить на вопрос хранит гугл страницы или нет? 🍿

хранить их совсем необязательно. как делает гугл - не знаю

L
На сайте с 25.12.2013
Offline
327
#119
Nickolay365:
текст хорошо сжимается. копии всех скачанных страниц, полагаю, гугл все равно хранит хотя бы на всякий случай. для этого не нужны быстрые винчестеры. можно хоть на магнитной ленте, так как доступ к архиву, если и будет, то крайне эпизодическим

Какие еще магнитные ленты!? У Гугла по всему свету разбросаны десятки тысяч самых современных серверов и это не считая железа под Ютуб, поэтому места у него более чем достаточно, чтобы хранить данные еще на 10 лет вперед.

Недорогой, надежный и отзывчивый VPS хостинг ( https://bit.ly/3eXUnNN ) Проверенная пуш партнерка с ежедневными выплатами ( https://vk.cc/9wLSrL)
[Удален]
#120
Lastwarrior:
Какие еще магнитные ленты!? У Гугла по всему свету разбросаны десятки тысяч самых современных серверов и это не считая железа под Ютуб, поэтому места у него более чем достаточно, чтобы хранить данные еще на 10 лет вперед.

речь здесь не про все данные, а про страницы, скачанные гугл ботом. у каждой страницы может быть n ревизий, так как гугл бот может скачать страницу n раз. сам текст страницы после обработки уже не требуется, уж не говоря о ревизии страницы, которую гугл бот скачал, например, год назад. поэтому нецелесообразно хранить архив на хорошем железе, так как доступ к нему вряд ли будет нужен

с ютюбом то же самое. на быстром железе имеет смысл хранить только востребованный контент. если у видео 3 просмотра, то какой смысл тратить на него место на ssd

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий