Индекс цитируемости в каталоге апорта это не количество ссылающихся сайтов, см. и многочисленные топики про Page Rank в разделе Link Popularity.
В частности, ссылки с каталогов обычно ненамного увеличивают индекс цитируемости (так как обычно страница каталога имеет небольшой ИЦ и много исходящих ссылок). А ссылки со страниц с "?" в адресе не учитываются, так как апорт эти страницы не индексирует...
Нет, не собираемся.
У такого способа подсчета свои недостатки.
Во-первых, нужно распознавать хостинг нескольких сайтов на одном домене, причем совершенно необязательно все эти сайты зарегистрированы в каталоге. Крупные хостинги определить можно, а вот с мелкими будут проблемы
Во-вторых, тематические разделы сайтов могут быть организованы как каталоги, а могут как домены третьего уровня. ИЦ будет разный, хотя по сути отличий нет
В-третьих, при клике на сайт в каталоге пользователь читает описание относящееся к сайту в целом и находится в соответствующей тематической категории: это имеет значение, если на сайте есть популярный раздел, не относящийся к основной тематике сайта
Ну и чисто практические соображения тоже важны, сейчас у нас один ИЦ для каталога и поисковой системы, что, конечно, проще и удобнее чем два разных
исправлен один редко проявлявшийся глюк (касавшийся только каталога)
htm и php ни при чем, ссылка на заглавную страницу сайта это href=www.site.ru
Нет, не хочу, как правильно (а иногда и хитро) сформулировать запрос я и сам неплохо представляю Но только научить компьютер переводить запросы на естественном языке в эти самые правильные запросы (то есть делать то с чем эксперты справляются в "кратчайшее время") очень сложно... И вообще, если уж поисковику учиться на чужих запросах, то скорее уж как раз на неудачных
feedback@agama.com
Период переиндексации один-два месяца обычно
Апортом, на данный момент, второй адрес не будет учитываться...
Апорт добавление отдельных страниц сайта не поддерживает, никакого эффекта от этой операции не будет (даже отрицательного )
правильно !
робот поисковика этот просто Апорт
Илья, спасибо за проведенное исследование
Поставленную задачу - оценить абсолютные размеры баз поисковиков, оно решает вполне адекватно.
Судя по апортовским логам, из запросов, по которым ничего не находится, случаи, когда в базе действительно нет информации, которую ищет пользователь составляют процентов 10-15. В остальных случаях информация есть, но запрос плохо сформулирован: с орфографическими ошибками (около 40%), слишком детализированно (многословно), с семантическими ошибками... Конечно, иногда в этих случаях полнота базы может помочь все-таки найти то что требовалось, но такие случаи составляют явное меньшинство и проблема тут, все-таки, не в полноте... А из упомянутых 10-15% значительную часть составляют запросы, по которым информации в интернете (российском) просто нет, и, соответственно, полнота базы не имеет никакого значения.
Среди запросов, по которым нашлось немного, "хороших", наверняка, больше (не знаю, насколько...), с другой стороны, не всегда тут немного означает недостаточно.
В то же время, то что найдено много, еще не гарантирует, что полнота базы неважна (процент случаев, когда это так, невелик, но абсолютное значение может оказаться довольно значительным).
В общем, я не думаю, что значение полноты базы для качества поиска можно оценивать по количеству запросов давших небольшое количество результатов.