Российские пользователи интернета не ограничиваются русскоязычными ресурсами — им интересны страницы и сайты на разных языках. Примерно 15 процентов запросов к Яндексу не содержат кириллицу.
Яндекс давно индексирует иностранные документы, размещенные в так называемой русскоязычной зоне интернета (домены государств СНГ и крупные сайты со всего мира, полезные русскоязычным пользователям). Теперь мы существенно расширили базу за счет зарубежного интернета. Пока в выдачу по запросу попадает не более одного иностранного документа из этой зоны. Ранжирование происходит в соответствии с общими правилами, то есть, такой документ окажется на первом месте, только если он наиболее соответствует запросу.
Размер базы зарубежного интернета — примерно 1 млрд веб-страниц, и эта цифра будет расти.
Примеры:
* flickr — http://www.yandex.ru/yandsearch?text=flickr
* BBDO — http://www.yandex.ru/yandsearch?text=BBDO
* Nick Hornby About a Boy — http://www.yandex.ru/yandsearch?text=Nick+Hornby+About+a+Boy
* Southland Tales — http://www.yandex.ru/yandsearch?text=Southland+Tales
Подмешивание документов из зарубежного интернета в основную выдачу сейчас носит экспериментальный характер. После сбора статистики и пользовательских отзывов ранжирование для таких документов будет значительно улучшено.