Этот рейтинг зависит только от количества переходов по данной ссылке на сайт. Но по умолчанию сортировка идет алфавитная, и ее очень редко кто меняет. Следовательно, на первой странице оказываются сайты с удачными названиями, а не содержанием. А т.к. около 80% посетителей забирают ссылки на первой странице, всем остальным достается большой кукиш.
Вероятно, это может быть и один сайт, и разные. Однозначного ответа не существует, потому что не так давно многие сайты не имели доменного имени. Как Яндекс это определяет? Его решение, скорее всего, зависит от многих факторов. Если бы я сам писал код поисковика, в число таких факторов я бы включил:
1) есть ли относительные (не абсолютные) ссылки со страницы .../yourname1/ на страницу .../yourname2/, и наоборот? Если есть, значит это часть одного сайта;
2) регистрировались ли эти URL самостоятельно, или Яндекс нашел их по ссылкам? Если самостоятельно, вероятность, что это отдельный сайт, выше;
3) существует ли возможность дойти по ссылкам со страницы .../yourname1/ до страницы .../yourname2/ (или наоборот), не выходя за пределы домена? Если нет, скорее всего, это разные сайты;
4) что говорит оценочная функция схожести дизайнов страницы? В нее может входить оценка того, насколько похожи цвет фона/тип background, насколько близки title/description/author, совпадают ли имена основных графических элементов на страницах и т.д.;
5) есть ли символ "~" перед названием страницы, вроде .../~yourname1/? Довольно заметная часть имен сайтов, не имеющих своего домена, начиналась именно с этого символа, например, http://www.aha.ru/~exler
и т.д.
Если интересует точный ответ, у Яндекса есть форум "Все вопросы к Яндексу",
http://forum.yandex.ru/?forum=188
специально предназначенный для вопросов о том, как функционирует этот поисковик. Сотрудники Яндекса, как правило, отвечают в течение 1-3 дней, в зависимости от того, насколько сложный вопрос и в какой день он был задан.
Я задал там этот вопрос, если ответ последует, я укажу его здесь.
2All: Не ленитесь спрашивать сами и публиковать тут ответы! Если вся информация будет собрана в одном месте, это облегчит всем нам жизнь.
Опыта в данном вопросе у меня нет, но то, что я читал на эту тему выглядит так:
1) поисковик либо индексирует динамическую страницу, либо нет. Заставить его индексировать, если он не хочет это делать, крайне сложно;
2) Яндекс индексирует (я сам проверил).
Просьба перед написанием письма в форум прочесть все, что написано ранее.
Действительно, как заметили тут раньше (см. http://www.besplatno.ru/se/ubb/Forum4/HTML/000007.html), Яндекс индексирует вначале заголовок, мета-тэги и описание, а сам сайт индексируется примерно через две недели.
2Gray: пора создавать FAQ.
[This message has been edited by funsad (edited 28-11-2000).]
Сколько именно (в Кб или словах) любит AltaVista? Включает ли размер страницы в себя html-тэги, скрипты, или только чистый текст?
Да, что такое WPG Page Critic и где его найти?
URL, сестра! Я это прочел в первый раз и хотел бы расспросить о подробностях: чем ему так нравятся большие страницы (в AV, как я понимаю, любовь к малым формам веб-искусства обоснована противодействием спамдексингу)? Насколько большие страницы любит Яндекс? В общем, побольше чисел и фактов.
Это зависит от частоты обновления твоего ресурса, а при высокой частоте -- есть ли твой ресурс в списке их выделенного crawler-а. У Яндекса точно есть отдельные crawler-ы для новостей и для сайта narod.ru (правда, загруженность последнего может оказаться даже выше, чем у любого другого).
Это сильно зависит от поисковика: для одних это несущественно, другие CSS не воспринимают. У меня, к сожалению, нет подробной информации, поэтому если тебя интересует, поройся в разделе помощи поисковиков или задай вопрос их службе техподдержки.
Если не ошибаюсь, это всего лишь означает, что при сортировке по дате твой документ будет болтаться где-то позади, равно как и при поиске с ограничением даты он не будет найден.
На переиндексацию, скорее всего, это влиять не должно: слишком много серверов чувствуют себя счастливыми, не наблюдая часов. Если их не учитывать, это сильно снизит релевантность поиска.
Для начала поставь слово "астрономия" в заголовке и description. Например, в заголовке:
"Далекая Галактика - убежище для звёздных скитальцев. Вы найдете тут удивительный мир астрономии"
В description:
"Далёкая Галактика - сайт про астрономию. На нем собрано огромное количество фотографий...".
Уже одно это поднимет тебя в рейтинге. Вдобавок можно уменьшить никому ненужный в таких размерах логотип (аж 759х126 пикселов!), а за счет освободившегося места под ним поместить заголовок шрифтом h1, вроде:
<b><h1>Удивительный мир астрономии</h1></b>
После этого, думаю, ты попадешь в top-10.
Если не считать утопических идей вроде "предложить SE разработать механизм индексации flash", самый простой способ -- создание входных страниц, ссылки в которых ведут на один из разделов flash-сайта. А еще лучше -- копия сайта на html, не у всех есть время и желание грузить flash.
А чего уж на два, лучше сразу на три, потому что в ближайшее время сильные конкуренты у Rambler/Aport/Yandex вряд ли появятся.
Но наверняка есть часть дискуссий, касающаяся всех русскоязычных поисковых систем вместе взятых. Возможно, эти обсуждения также стоит вынести в отдельный раздел. Главное -- не запутаться.