Можно подставить в параметрах поискового url'а charset=win вместо charset=koi8.
Несколько лет назад я написал статью о архитектуре метапоисковых систем. Ищите документы, указанные в списке литературы.
P.S. Beat, за размещение одних и тех же сообщений в разных темах в следующий раз получите бан.
Да, новость удалась на славу. :) Спустя полчаса после публикации эта новость облетела яндекс и поток счастливых яндексоидов едва не обвалил мне сайт. 😂
Могу выдать такую базу, но с одним условием - можно будет посмотреть результаты и получить краткое описание алгоритма :) Если это не проблема, то мой e-mail в профайле.
TREC
Реальность такова, что такой скрипт нужно писать самому. Или попытаться настроить mnogosearch, ссылку на который уже дали.
Хоть и с опозданием, но присоединяюсь. С днем рождения!
Насколько я могу судить, в открытом доступе на форуме статья не рассматривалась, однако мы с Андреем ее обсуждали в личной переписке.
Думаю, если Андрей не против, часть ее можно опубликовать - она довольно интересна.
Скорее всего, под "социальной структурой интернета" Яндекс понимает различные типы страниц, несущие совершенно разные типы информации:
- информационные страницы;
- навигационные страницы;
- новости (важна актуальность - дата публикации);
- объявления (важна актуальность);
- форумы и гостевые книги;
- возможно, что-то еще...
Хотя стоит дождаться пресс-релиза от самого яндекса, чтобы делать какие-то выводы.
Ну, посмотрим :)
Статистика вроде бы работает быстро, но по субъективным ощущениям либо отстает по времени, либо показывает не совсем те данные. Ее не переделывали?
Каких, если не секрет? Кстати, поддержкой сейчас занимается новая команда или люди все те же?
Пока видно только, что перетянули к другому провайдеру и сменили стартовую страницу.
В последние годы Пинг часто валился и пребывал в ауте - теперь этого уже не будет?
Насколько он сейчас стабильно работает?