Технический вопрос СУБД Яндекс

J
На сайте с 29.06.2005
Offline
0
884

Интересует такой вопрос:

Какой тип базы данных использует яндекс (реляционный/постреляционный).

и общий принцип работы индекса. Меня давно заел этот вопрос, и вот наконец решился спросить. Прошу прощения, если высказал вопрос примитивно

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#1

http://company.yandex.ru/programs/web_200203.html - правда, теперь там всего больше.

J
На сайте с 29.06.2005
Offline
0
#2

Более менее понятно объяснен прицип обработки запросов, однако о типах хранения данных ни слова

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#3

а там оригинальная система хранения данных, насколько я знаю. Т.е. если вас интересует, а не mySQL ли, например, то советую обратиться в раздел "Поисковые технологии" - /ru/forum/optimization-practices/search-technologies

SS
На сайте с 03.09.2004
Offline
141
#4

Да, Сегалович говорил, что весь софт они для себя писали сами. Но точно не помню, где читал это - это или у них на форуме или здесь в "поисковых технологиях"

«Клянусь своей жизнью и любовью к ней, что никогда не буду жить ради другого человека и никогда не попрошу и не заставлю другого человека жить ради меня» (с) Джон Галт
Каширин
На сайте с 03.01.2004
Offline
1031
#5

Сокет 😎

RC
На сайте с 12.04.2005
Offline
18
#6

Моя системка полностью на php и роботы и всё остальное, а от СУБД пришлось отказаться вообще. В примитиве индекс приблизительно такой: лемма=файл. Получается быстрее значительно...

Больше я к realty.cd никакого отношения не имею. Компания разорилась, домен просрочен и регнут кем-то заново. Вот так вот.
J
На сайте с 29.06.2005
Offline
0
#7

RealtyCD
если не трудно рассказать принцип работы

RC
На сайте с 12.04.2005
Offline
18
#8

В кратце:

каждому слову (точнее его значимой части - лемме) соответствует файл в котором сохраняются данные о его местоположении (URL, место в тексте). В моем случае это сжатые текстовые файлы. При поиске выбирается наименьший по размеру файл (из слов запроса) и далее проверяется соответствие остальным словам запроса.

Т.е. в принципе, если бы запрос состоял из одного слова, то суть выдачи результата сводилась бы к выдаче содержимого этого файла.

Выглядит это приблизительно вот так: \folder\s\slovo.gz

Т.е. получив запрос "slovo" мы просто открываем файл "slovo" :)

У меня получилось около 400 000 таких вот файлов.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий