На амазоне Information Retrieval стоил, по-моему, в пределах 75 долларов. Modern Information Retrieval тех же авторов - того же порядка. Обе книги рекомендую весьма.
Илья
Потрясающий список! Где Вы его собрали?
Ничего из этого не знал. Зато платные службы (типа той, что на tela) замучили своими приглашениями.
Кстати, напрочь забыты два обстоятельства.
- Число дублей
- Число дохлых ссылок
Понятно ведь, что можно быть "страшно релевантным" но при этом (или из-за этого ) "страшно медленным".
Раз пошла такая пьянка, вот моя
упрощенная процедура:
Берем N запросов. Примерно одной тематики. Например геология или математика (можно перевести Гиля на русский )
Делаем их в режиме "по умолчанию" на всех серверах.
Первые десять линков копируем и отдаем товарищу вместе с текстом запроса, но без имени искалки, (при этом запомнив с какой искалки Вы их взяли)
Товарищ считает первую десятку по следующей процедуре.
- Устанавливает все счетчики в ноль
- Открывает каждый линк по очереди.
- Если не в тему (очевидным образом ),
инкрементирует счетчик "не по теме"
- Если этот (или "почти тот же")
документ уже был, инкрементирует
счетчик "дублей"
- Если не открылось,
инкрементирует счетчик "дохлых линков"
Все счетчики по результатам изучения осредняются для каждой искалки.
Таким образом искалка получает три оценки,
из которых можно при желании сварганить
интегральный показатель.
Илья Сегалович, Яндекс.
А как Вы проверяте?
Надо так: #url="ваш_урл"
По идее, если все добавилось (об этом сообщает добаляющий скрипт) в выдаче ваш документ должен быть уже через 15 минут.
Добрый вечер.
При первом посещении документ полностью индексируется. Более выское ранжирование "новых" страниц в текущем поиске Яндекса действительно присутствует, но оно никак не связано с "весовыми коэффициентами слов" или чем-нибудь подобным.
Жизнь "нового документа" такова:
1. Мгновенная полная индексация и появление в поиске через 15 минут. Этим свойством Яндекса активно пользуются и пользовались многие новостные агентства (Максим Мошков из Ленту.Ру, например). Хотя теперь, после появления отдельной эффективно индексируемой секции новостей на выдаче, а также news.yandex.ru, это совершенно не требуется.
2. Передача роботу всего нового сайта, его раскрутка по ссылкам, и более полное индексирование происходит примерно в течении 1-2-х недель.
Заметьте, что повышенная активность в добавлении УРЛ одного сайта часто фиксируется и пресекается.
Это неправда. Комментарии и скрипты, так же как и стили, не индексируются последние полтора года. При чем тут "способ спама" я совершенно не понял.
Мы стараемся вычищать малосодержательные поисковые скрипты. Причем, в основном, полагаемся на "умную вычищалку", которую, так же как и "нечеткую сливалку почти зеркальных серверов", запустили летом этого года. Что касается каталогов, Вы правы, их в выдаче - некоторый перебор.
Индекс цитирования напрямую в релевантности страницы пока не участвует. Популярность документа по ссылкам (опосредованно, через лексику самих ссылок) мы сейчас доделываем.
Ох, как эпично! Аж в новом тысячелетии.
Не очень хочется рассказывать о не сделанном. А вдруг не сделаем
Как сделаем - так и расскажем.
http://www.yandex.ru/cgi/forum0/index.pl?period=5
Почитайте архив нашего форума, например, дискуссию с Максимом из "Кодекса" или с
Константином Кнопом. ИМХО, гораздо интересней, чем все Ваши дорвеи вкупе
с клоаками.
Илья Сегалович, Яндекс
Там, по сообщению Яндекса, не менее 5489 документов, содержащих в точности эту фразу.
Наш форум живет уже более 2-х лет. Число неотвеченных писем вы правы - великовато.
Дело в том, что на этом форуме отвечают разработчики. Когда большая загрузка - они (мы) не успеваем.
Зато рядом живет форум "где найти" и там десятки писем в день, причем все (или почти все) с ответами. Такая служба - совершенно точно - уникальная (есть аналоги но платные)
Илья Сегалович, Яndex
Да, и Yandex Support и dz действительно из Яндекса. Действительно какое-то время назад мы ответили отказом на участие в этом форуме. Тогда он, в основном, был посвящен способам заспаммить поисковики и повыгоднее продать свои умения в этой малоприятной для подавляющего большинства пользователей сфере деятельности.
Сечас на Ваш форму пришел Игорь Ашманов и тут завязалась какая-то разумная жизнь. Иногда звучат разные неверные утверждения насчет Яндкса. Поэтому волей неволей пришлось вступить в дискуссию.