Хороший обзор. Небольшие комментарии.
1.
Можно, причем официально. Смотрим сюда:
5-я ссылка, стоимость за 1000 показов -- $75, эксклюзивное размещение по ключевым словам - $150. Конечно, это не любое "более высокое место", но это и не "честная" нулевая ссылка.
2.
Мне кажется, это происходит потому, что в расширенном поиске Яндекса можно действительно удобней искать сложные запросы, а расширенный поиск Апорта мало что дает.
3.
Это почему она должна получаться первой? Если сделать грубую прикидку, то на первую ссылку из Яндекса по данному запросу ссылаются 73 страницы (Google знает 336), а на мошковскую страницу -- 13 (Google знает 25). Может, дело в весах ссылающихся сайтов? Конечно, их сложно оценить, но примерно прикинуть можно, взглянув на список ссылающихся сайтов.
Google:
www.websher.net/
www.arachnet.org/
www.cs.bgu.ac.il/
kulichki.rambler.ru/
cweb.middlebury.edu/
www.lib.ru/
www.sparc.spb.su/
www.kulichki.com/
vampirus.narod.ru/
www.rusf.ru/
www.russ.ru/
twt.mpei.ac.ru/
www.ezhe.ru/
www.lyceum.edu.ru/
tba.narod.ru/
www.stphilaret.org/
Яндекс:
ixtlan.boom.ru/
teterin.raid.ru/
www.teterin.raid.ru/
anastassia2001.narod.ru/
www.kozanostra.ru:8080/
pers.newmail.ru/
www.grani.ru/
www.kayak.ru/
nafnaf.narod.ru/
womendog.kulichki.net/
www.ckp.ru/biblio/
Как видно, у Google встречаются такие монстры (наверняка с большим весом), как kulichki.rambler.ru, www.kulichki.com, www.rusf.ru, www.russ.ru, у Яндекса их нет. Поэтому, на мой взгляд, проблема не в алгоритме, и даже не в объеме базы поисковика (здесь она Google несущественно больше). Проблема в том, что тест Носика -- это лишь частный случай. Попробуйте-ка поискать по запросу "Чапаев и Пустота" -- и в Google, и в Яндекс на первом месте мошковская книга, "Анна Каренина" -- у обоих поисковиков на первом месте одна книга, поищите "Мертвые души" и т.д.
4.
Мне кажется, это были бы слишком большие накладные расходы -- выполнять скрипты. Пытаясь уменьшить нагрузку, многие поисковики не индексируют даже CSS, а тут исполнение скриптов. Тем более, что Яндекс их даже не индексирует. Впрочем, жизнь бывает более неожиданной, чем ждут от нее.
С уважением,
Александр Садовский.
Не такой уж он и новый...
А создан вообще в 2000.
Тот же, что и апортовское или гугловское "найдено по ссылке". Не все страницы, стоящие в очередь на индексацию, проиндексированы, и не все будут индексироваться в принципе (например, Яндекс игнорирует 99% забугорья). Но если на какой-то сайт очень часто ссылаются со словами "мастдай", то велика вероятность, что этому мастдаю сайт и посвящен. Именно поэтому по запросу "мастдай" третий документ -- страничка Microsoft, тоже "найдено по ссылке".
Судя по адресу e-mail, Михаил работает в Апорте. Добро пожаловать на форум! Надеемся на Ваше активное участие.
Отставка Ашманова принята.
Нетоскоп: В Рамблер пришел новый акционер - инвестиционный банк First Mercantile Capital Group
@-Daily: В Рамблере власть перешла к временному правительству
Комментарии Ашманова:
@-Daily: У Игоря Ашманова нет причин торопиться
Возможно, в какой-то раз была большая нагрузка на поисковик, и часть серверов не успела ответить. Возможно, за время, прошедшее межде запросами, добавились сайты в индекс. Возможно... Да мало ли что может быть.
Вы же не спрашиваете, почему на одной и той же дороге, сидя в одной и той же машине, водитель управляет всегда по-разному? Ведь то, как он управляет автомобилем, зависит от трафика, от погоды, наличия гаишников и т. д.
На мой взгляд, стало менее удобно, когда информация о числе найденных страниц/серверов указывается внизу выдачи. Раньше можно было мгновенно оценить удачность запроса, почувствовать его "жесткость" или, наоборот, "расплывчатость" по первым 2-3 результатам поиска и количеству найденных страниц, теперь же приходится пролистывать до конца.
Под другим именем, не как Рамблер (как сделала АльтаВиста).
Классно. Действительно, стало значительно точнее, особенно, когда идет поиск по популярным темам. Есть и недостатки, свойственные алгоритму PageRank. По сути, число ссылок на сайт -- это отложенная популярность с привкусом качества. Когда качество берет верх, тут все ясно, но иногда более популярный ресурс или дольше существующий обгоняет более качественный. Кроме того, есть казусы подобные гугловским -- например, на запрос "графоман" десятым вылазит сайт Экслера.
Подробности реализации все равно интересны. Например, учитываются в LP сайты или страницы? Играет ли роль тематика ссылающихся сайтов? И т.д. Если же алгоритм был реализован тютелька в тютельку с гугловским, было бы интересно увидеть ссылку на потроха гугловского PageRank.
Про перефразировку вопросов тоже интересно. Использовался свой собственный алгоритм или что-то известное? Как именно происходит перефразировка?
P.S.
Не, от нас пресс-релизом не отделаться! А вообще поздравляю с очередным этапом в развитии. Успехов и в дальнейшем!
Точно, это была провокация Носика. Вот слова Ашманова:
http://www.netoscope.ru/news/2001/05/22/2376.html