Базы данных поисковиков и не только

12
Н
На сайте с 13.04.2003
Offline
0
7115

Какие базы данных используют поисковики? Ну скажем самые популярные - Google, Yandex, Yahoo - именно названия и где эти базы созданны были.

В чем их преимущества. И под управлением каких операционных систем стоит это все дело??

Я так понимаю , к примеру у Google, кластренизация осуществленна , с помощью чего?? вообще интересует все технические вопросы связанные с ПО используемым совместно с Поисковыми системами крупными.

Да и оборудование тоже было бы знать неплохо - какая структура сети, какие компьютеры и дополнительное оборудование - к примеру аппаратные или программные распределители нагрузки и прочее дело:)

Интересует Все Все Все!!!

Ashmanov
На сайте с 21.11.2000
Offline
66
#1

Уважаемый Незнайка!

Всё-таки вопросов многовато. Просто как в книжке Носова.

Неспроста никто не торопится отвечать. Время дорого, а тут вопросов на часы написания ответов.

А поисковиками не пробовали пользоваться? Архитектура и аппаратное обеспечение подробно описано и у Гугла, и у Яндекса, стоит только спросить у них самих.

С уважением, Игорь Ашманов Все для оптимизации (рассылка, сервисы): www.optimization.ru (www.optimization.ru) Сервис по созданию собственных поисковиков: www.flexum.ru (www.flexum.ru)
vmegap
На сайте с 03.02.2002
Offline
158
#2
Как писал Незнайка
Какие базы данных используют поисковики? Ну скажем самые популярные - Google, Yandex, Yahoo - именно названия и где эти базы созданны были.
В чем их преимущества. И под управлением каких операционных систем стоит это все дело??

Гугль с самого начала своего существования использовал операционку Линукс. Что не удивительно - везде наш народ :) Штаб квартира у Гугля - недалеко от Пало Альто, в Калифорнии, сервера (54 тысячи) расположены в двух разных местах ( в Мемфисе, кажется, второе уже не помню). Для интересующихся Гуглем - какую-то информацию можно почерпнуть тут.

По Яндексу лучше спросить у Ильи Сегаловича.

С уважением,

Виктор

Н
На сайте с 13.04.2003
Offline
0
#3

Доброе время суток:)

Я тут пошарил по инету нашел всякой всячины и отпало сразу кучу вопросов.

Вот только интересует про базы данных всеж - какие используют?

Я слышал что Гугл использует что то наподобе PostgreSQL - правда ли это?

Да и вообще из доступных - какие лучше для таких дел? Если база данных гигобайтами исчисляется?

Плюс вопрос какую именно версию FreeBSD и Apache использует Яндекс?

Так же я понял что у Яндекса несколько десятков серверов всего лишь, ну скажем там Наааамного меньше чем у Гугла а объемы информации которыми он ворочает не намного меннее пропорциональны?? как это объяснить?

vmegap
На сайте с 03.02.2002
Offline
158
#4
Как писал Незнайка
Доброе время суток:)
Так же я понял что у Яндекса несколько десятков серверов всего лишь, ну скажем там Наааамного меньше чем у Гугла а объемы информации которыми он ворочает не намного меннее пропорциональны?? как это объяснить?

56 серверов у Яндекса, если не ошибаюсь. У Гугля - 54 тысячи.

Яндекс индексирует Рунет. Гугль - Инет.

Почувствуйте разницу.

С уважением,

Виктор

Н
На сайте с 13.04.2003
Offline
0
#5

Уважаемый vmegap:) вот и я про тоже; ну не в пачти тысячу же раз Гугл больше а? как это объяснить?? неэффективностью организации?? или какие то дополнительные сервисы гугла?

vmegap
На сайте с 03.02.2002
Offline
158
#6
Как писал Незнайка
Уважаемый vmegap:) вот и я про тоже; ну не в пачти тысячу же раз Гугл больше а? как это объяснить?? неэффективностью организации?? или какие то дополнительные сервисы гугла?

Гугль индексирует все языки мира. Англоязычный инет не в пример рунету заселен гораздо большим количество сайтов. Это к вопросу о сравнении объема баз Гугля и Яндекса.

Сколько человек работает в Яндексе? Когда был там, не удосужился посчитать:). Не очень много. В Гугле больше - около 200.

Гугль изначально создавался как игрушка богатых студентов Станфорда, которые смогли себе позволить выкинуть на рискованную затею аж 10,000 долларов личных сбережений.

Кстати, даже после того, как Гугль стал крутым и престижным поисковиком, зарплаты сотрудников там весьма скромные - на уровне $ 60,000 в год. Для Силиконовой долины - это копейки, для интернет-компании такого уровня - недоразумение. Яндекс в этом плане выглядит более предпочтительно в плане финансового обеспечения работников (с учетом соотношений зарплаты с общей стоимостью жизни в стране, конечно).

С уважением,

Виктор

Н
На сайте с 13.04.2003
Offline
0
#7

vmegap, в 56 серверов яндекса входит почтовая система ?? если да - то все равно непонятно, ну даже при индексировании гуглом всего остального он что больше Яндекса в тусячу раз по обему хранимой информации?

N
На сайте с 14.11.2001
Offline
53
nis
#8

сравните

http://www.google.com.ru/

В индексе 3,083,324,652 документов

http://www.yandex.ru/chisla.html

Количество уникальных документов: 88 032 308

Кроме того это также зависит и от нагрузки (количества запросов в секунду)

Д
На сайте с 27.11.2002
Offline
23
#9

Зачем задавать гипотетические вопросы? Сервер серверу рознь... У Яндекса мало, но толстые :D ...

S
На сайте с 03.05.2002
Offline
25
#10

> Вот только интересует про базы данных всеж - какие используют?

Никакие - http://www7.scu.edu.au/programme/fullpapers/1921/com1921.htm

Точнее, наверняка используют что-нибудь для вспомогательных целей, а для поиска стандартные базы не годятся, свои пишутся.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий