24 сентября в Новосибирске прошел первый в Сибирском регионе Яндекс.Студень. В рамках этого события Илья Сегалович дал интервью изданию Sibnet.ru, в котором рассказал о будущем поиска, об искусственном интеллекте и даже о том, чем Яндекс лучше Google.
Отвечая на вопросы корреспондента, технический директор Яндекса в частности привел следующие факты:
- Яндекс обрабатывает порядка 150 млн. запросов в день, практически столько же, сколько жителей в России;
- на сегодняшний день поисковиком проиндексировано 10 млрд. документов, но знает он про 100 млрд.;
- ежедневно Яндексом выдается примерно 5 терабайт информации;
- всего в Яндексе 20 тыс. серверов, половина из них занимается исключительно поиском;
- офисы разработки Яндекса расположены в Москве, Симферополе, Екатеринбурге, Санкт-Петербурге и Калифорнии.
Илья Сегалович о ближайших перспективах поиска: «Смещается фокус активности – поиск переезжает в мобильный. Он перестает работать только как текстовый, он начинает быть звуковым и поиском через фотокамеру. Это то, что грядет, оно вступает в нашу жизнь».
Об отношении Яндекса к поисковым оптимизаторам: «В том, что касается ранжирования поиска, мы пытаемся все неконструктивные действия оптимизаторов свести к процессу, похожему на белый шум, чтобы позитивная обратная связь попросту не возникала. А в том, что касается хорошей оптимизации, мы понимаем, что это важно, и даже стараемся всячески в этом оптимизаторам помочь».
О преимуществах перед Google: «Во-первых, мы локальные, мы очень хорошо чувствуем свою аудиторию. Мы стараемся работать для нее. Во-вторых, у нас немножко больше ресурсов для того, чтобы проявить внимание к деталям. Например, наш региональный поиск гораздо более детальный, чему Google, мы гораздо больше внимания обращаем на региональные оценки. Кроме того, до 2006 года Google считал, что морфология вредна. Но Яндекс оказался трудным орешком, и они все-таки сделали морфологию для русского. После этого они сделали это во всем мире, они внедрили это для всех языков. Но почему они это сделали? Потому что им пришлось столкнуться с Яндексом. Мы помогли всему миру и это приятно».
Об искусственном интеллекте: «Вот уже 30 лет вокруг этого понятия было наверчено так много ерунды. Но вообще, такие вещи, как распознавание голоса – это классическая задача искусственного интеллекта. Вообще поиск – это классическая задача искусственного интеллекта. Просто сам поиск. Представьте себе, вам нужно в 10 млрд. документов найти 10. Вероятность здесь составляет 1 миллиардную, а вы за доли секунды получаете то, что надо. Это волшебство. В этом смысле да, мы команда, которая занимается искусственным интеллектом с самого рождения
У нас есть текстовый искусственный интеллект, у нас есть искусственный интеллект в картинках. И его развитию и обучению помогает огромное количество того, что есть в интернете и того, что именно люди делают в интернете. Это как живая вода. Вот есть данные – это мертвая вода, и есть пользователи – это живая вода. Живая вода добавляется к мертвой воде – возникает искусственный интеллект. Волшебство».