funsad

Рейтинг
116
Регистрация
15.11.2000

Хороший обзор. Небольшие комментарии.

1.

<font face="Verdana" size="2">...в "Апорте" нельзя купить не нулевое, а просто более высокое место для своего сайта в результатах поиска</font>

Можно, причем официально. Смотрим сюда:

5-я ссылка, стоимость за 1000 показов -- $75, эксклюзивное размещение по ключевым словам - $150. Конечно, это не любое "более высокое место", но это и не "честная" нулевая ссылка.

2.

<font face="Verdana" size="2">Пользователи "Апорта" (в отличие завсегдатаев "Яндекса") мало пользуются расширенным поиском</font>

Мне кажется, это происходит потому, что в расширенном поиске Яндекса можно действительно удобней искать сложные запросы, а расширенный поиск Апорта мало что дает.

3.

<font face="Verdana" size="2">Для оценки корректности вычисления Page Rank можно использовать тест Носика: при запросе "Мастер и Маргарита" первой в выдаче должна получаться начальная страница названного романа в "Библиотеке Мошкова" (как это и происходит в Google</font>

Это почему она должна получаться первой? Если сделать грубую прикидку, то на первую ссылку из Яндекса по данному запросу ссылаются 73 страницы (Google знает 336), а на мошковскую страницу -- 13 (Google знает 25). Может, дело в весах ссылающихся сайтов? Конечно, их сложно оценить, но примерно прикинуть можно, взглянув на список ссылающихся сайтов.

Google:

www.websher.net/

www.arachnet.org/

www.cs.bgu.ac.il/

kulichki.rambler.ru/

cweb.middlebury.edu/

www.lib.ru/

www.sparc.spb.su/

www.kulichki.com/

vampirus.narod.ru/

www.rusf.ru/

www.russ.ru/

twt.mpei.ac.ru/

www.ezhe.ru/

www.lyceum.edu.ru/

tba.narod.ru/

www.stphilaret.org/

Яндекс:

ixtlan.boom.ru/

teterin.raid.ru/

www.teterin.raid.ru/

anastassia2001.narod.ru/

www.kozanostra.ru:8080/

pers.newmail.ru/

www.grani.ru/

www.kayak.ru/

nafnaf.narod.ru/

www.ezhe.ru/

womendog.kulichki.net/

www.ckp.ru/biblio/

Как видно, у Google встречаются такие монстры (наверняка с большим весом), как kulichki.rambler.ru, www.kulichki.com, www.rusf.ru, www.russ.ru, у Яндекса их нет. Поэтому, на мой взгляд, проблема не в алгоритме, и даже не в объеме базы поисковика (здесь она Google несущественно больше). Проблема в том, что тест Носика -- это лишь частный случай. Попробуйте-ка поискать по запросу "Чапаев и Пустота" -- и в Google, и в Яндекс на первом месте мошковская книга, "Анна Каренина" -- у обоих поисковиков на первом месте одна книга, поищите "Мертвые души" и т.д.

4.

<font face="Verdana" size="2">если ссылка формируется с помощью Java-скрипта, "Рамблер" вообще по ней не пойдет, потому что он не исполняет скрипты. "Яндекс" поступает аналогично, однако его "паук" более "наглый", поэтому выполняет многие скрипты.</font>

Мне кажется, это были бы слишком большие накладные расходы -- выполнять скрипты. Пытаясь уменьшить нагрузку, многие поисковики не индексируют даже CSS, а тут исполнение скриптов. Тем более, что Яндекс их даже не индексирует. Впрочем, жизнь бывает более неожиданной, чем ждут от нее.

С уважением,

Александр Садовский.

<font face="Verdana" size="2">Originally posted by UrusHyby:
http://metabot.ru/
а кроме того, что он мета, так ещё и по ФТП-шникам поиск. Вообще, что-то зачастили эти новые..
</font>

Не такой уж он и новый...

А создан вообще в 2000.

С уважением,

Александр Садовский.

<font face="Verdana" size="2">Originally posted by Jack:
Кто может прокомментировать что это за вид ссылки?</font>

Тот же, что и апортовское или гугловское "найдено по ссылке". Не все страницы, стоящие в очередь на индексацию, проиндексированы, и не все будут индексироваться в принципе (например, Яндекс игнорирует 99% забугорья). Но если на какой-то сайт очень часто ссылаются со словами "мастдай", то велика вероятность, что этому мастдаю сайт и посвящен. Именно поэтому по запросу "мастдай" третий документ -- страничка Microsoft, тоже "найдено по ссылке".

С уважением,

Александр Садовский.

<font face="Verdana" size="2">Originally posted by Basilisk:
misha, а информация получена от Апорта или это собственные наблюдения?</font>

Судя по адресу e-mail, Михаил работает в Апорте. Добро пожаловать на форум! Надеемся на Ваше активное участие.

С уважением,

Александр Садовский.

<font face="Verdana" size="2">Originally posted by QI:
Почему при одном и том же запросе yandex выдает разные результаты?</font>

Возможно, в какой-то раз была большая нагрузка на поисковик, и часть серверов не успела ответить. Возможно, за время, прошедшее межде запросами, добавились сайты в индекс. Возможно... Да мало ли что может быть.

Вы же не спрашиваете, почему на одной и той же дороге, сидя в одной и той же машине, водитель управляет всегда по-разному? Ведь то, как он управляет автомобилем, зависит от трафика, от погоды, наличия гаишников и т. д.

С уважением,

Александр Садовский.

На мой взгляд, стало менее удобно, когда информация о числе найденных страниц/серверов указывается внизу выдачи. Раньше можно было мгновенно оценить удачность запроса, почувствовать его "жесткость" или, наоборот, "расплывчатость" по первым 2-3 результатам поиска и количеству найденных страниц, теперь же приходится пролистывать до конца.

<font face="Verdana" size="2">Originally posted by Gray:
Лихая нововсть. Правда, не могу понять, как могут наравне функционировать два движка поиска.</font>

Под другим именем, не как Рамблер (как сделала АльтаВиста).

С уважением,

Александр Садовский.

<font face="Verdana" size="2">Originally posted by iseg:
  • поиск по лексике ссылок ((c) Волож, Сегалович, "Справочник МКИ", 1991 год )
  • PageRank, ((с) Brin, Page, "Google", 1998 год )
</font>

Классно. Действительно, стало значительно точнее, особенно, когда идет поиск по популярным темам. Есть и недостатки, свойственные алгоритму PageRank. По сути, число ссылок на сайт -- это отложенная популярность с привкусом качества. Когда качество берет верх, тут все ясно, но иногда более популярный ресурс или дольше существующий обгоняет более качественный. Кроме того, есть казусы подобные гугловским -- например, на запрос "графоман" десятым вылазит сайт Экслера.

<font face="Verdana" size="2">Подробнее не объясняю, надеюсь все здесь профессионалы и понимают, о чем идет речь.</font>

Подробности реализации все равно интересны. Например, учитываются в LP сайты или страницы? Играет ли роль тематика ссылающихся сайтов? И т.д. Если же алгоритм был реализован тютелька в тютельку с гугловским, было бы интересно увидеть ссылку на потроха гугловского PageRank.

<font face="Verdana" size="2">Кроме того, есть перефразировка популярных ЕЯ-вопросов, исправление опечаток и куча других мелочей.</font>

Про перефразировку вопросов тоже интересно. Использовался свой собственный алгоритм или что-то известное? Как именно происходит перефразировка?

С уважением,

Александр Садовский.

P.S.

Не, от нас пресс-релизом не отделаться! А вообще поздравляю с очередным этапом в развитии. Успехов и в дальнейшем!

<font face="Verdana" size="2">Originally posted by wolf:
Оказывается, еще ничего не решено с приходом Носика и уходом Ашманова.</font>

Точно, это была провокация Носика. Вот слова Ашманова:

http://www.netoscope.ru/news/2001/05/22/2376.html

С уважением,

Александр Садовский.

Всего: 1503