misha

Рейтинг
23
Регистрация
05.06.2001

Индекс цитируемости в каталоге апорта это не количество ссылающихся сайтов, см. и многочисленные топики про Page Rank в разделе Link Popularity.

В частности, ссылки с каталогов обычно ненамного увеличивают индекс цитируемости (так как обычно страница каталога имеет небольшой ИЦ и много исходящих ссылок). А ссылки со страниц с "?" в адресе не учитываются, так как апорт эти страницы не индексирует...

Originally posted by Sad Spirit:
А вы, кстати, не собираетесь это менять? Сделать, хотя бы, как в Яндексе, чтобы ИЦ считался по сайтам, а сайт определялся как "сущность имеющаяся в каталоге"?

Нет, не собираемся.

У такого способа подсчета свои недостатки.

Во-первых, нужно распознавать хостинг нескольких сайтов на одном домене, причем совершенно необязательно все эти сайты зарегистрированы в каталоге. Крупные хостинги определить можно, а вот с мелкими будут проблемы

Во-вторых, тематические разделы сайтов могут быть организованы как каталоги, а могут как домены третьего уровня. ИЦ будет разный, хотя по сути отличий нет

В-третьих, при клике на сайт в каталоге пользователь читает описание относящееся к сайту в целом и находится в соответствующей тематической категории: это имеет значение, если на сайте есть популярный раздел, не относящийся к основной тематике сайта

Ну и чисто практические соображения тоже важны, сейчас у нас один ИЦ для каталога и поисковой системы, что, конечно, проще и удобнее чем два разных

исправлен один редко проявлявшийся глюк (касавшийся только каталога)

htm и php ни при чем, ссылка на заглавную страницу сайта это href=www.site.ru

<font face="Verdana" size="2">Originally posted by funsad:
На мой взгляд, это очень ценные сведения, которые конкуренты Яндекса не отказались бы купить, но кто ж им продаст?
</font>

Нет, не хочу, как правильно (а иногда и хитро) сформулировать запрос я и сам неплохо представляю Но только научить компьютер переводить запросы на естественном языке в эти самые правильные запросы (то есть делать то с чем эксперты справляются в "кратчайшее время") очень сложно... И вообще, если уж поисковику учиться на чужих запросах, то скорее уж как раз на неудачных

feedback@agama.com

Период переиндексации один-два месяца обычно

Апортом, на данный момент, второй адрес не будет учитываться...

Апорт добавление отдельных страниц сайта не поддерживает, никакого эффекта от этой операции не будет (даже отрицательного )

правильно !

робот поисковика этот просто Апорт

Илья, спасибо за проведенное исследование

Поставленную задачу - оценить абсолютные размеры баз поисковиков, оно решает вполне адекватно.

<font face="Verdana" size="2"> Абсолютный размер базы данных (например, измерямый числом разных проиндексированных документов) имеет значение при поиске.
Примерно в 20-40 процентах запросов.
Именно такое количество запросов на Яндексе находит относительно небольшое, перечислимое число документов, а значит, и полнота базы становится важным фактором.
</font>

Судя по апортовским логам, из запросов, по которым ничего не находится, случаи, когда в базе действительно нет информации, которую ищет пользователь составляют процентов 10-15. В остальных случаях информация есть, но запрос плохо сформулирован: с орфографическими ошибками (около 40%), слишком детализированно (многословно), с семантическими ошибками... Конечно, иногда в этих случаях полнота базы может помочь все-таки найти то что требовалось, но такие случаи составляют явное меньшинство и проблема тут, все-таки, не в полноте... А из упомянутых 10-15% значительную часть составляют запросы, по которым информации в интернете (российском) просто нет, и, соответственно, полнота базы не имеет никакого значения.

Среди запросов, по которым нашлось немного, "хороших", наверняка, больше (не знаю, насколько...), с другой стороны, не всегда тут немного означает недостаточно.

В то же время, то что найдено много, еще не гарантирует, что полнота базы неважна (процент случаев, когда это так, невелик, но абсолютное значение может оказаться довольно значительным).

В общем, я не думаю, что значение полноты базы для качества поиска можно оценивать по количеству запросов давших небольшое количество результатов.

Всего: 59