- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Интересует такой вопрос:
Какой тип базы данных использует яндекс (реляционный/постреляционный).
и общий принцип работы индекса. Меня давно заел этот вопрос, и вот наконец решился спросить. Прошу прощения, если высказал вопрос примитивно
http://company.yandex.ru/programs/web_200203.html - правда, теперь там всего больше.
Более менее понятно объяснен прицип обработки запросов, однако о типах хранения данных ни слова
а там оригинальная система хранения данных, насколько я знаю. Т.е. если вас интересует, а не mySQL ли, например, то советую обратиться в раздел "Поисковые технологии" - /ru/forum/optimization-practices/search-technologies
Да, Сегалович говорил, что весь софт они для себя писали сами. Но точно не помню, где читал это - это или у них на форуме или здесь в "поисковых технологиях"
Сокет 😎
Моя системка полностью на php и роботы и всё остальное, а от СУБД пришлось отказаться вообще. В примитиве индекс приблизительно такой: лемма=файл. Получается быстрее значительно...
RealtyCD
если не трудно рассказать принцип работы
В кратце:
каждому слову (точнее его значимой части - лемме) соответствует файл в котором сохраняются данные о его местоположении (URL, место в тексте). В моем случае это сжатые текстовые файлы. При поиске выбирается наименьший по размеру файл (из слов запроса) и далее проверяется соответствие остальным словам запроса.
Т.е. в принципе, если бы запрос состоял из одного слова, то суть выдачи результата сводилась бы к выдаче содержимого этого файла.
Выглядит это приблизительно вот так: \folder\s\slovo.gz
Т.е. получив запрос "slovo" мы просто открываем файл "slovo" :)
У меня получилось около 400 000 таких вот файлов.