Почему же, основная страница http://about.al.ru/autosubmitter.html в базе есть, а входная (я не помню ее адрес)... Значит ее сочли спамом.
После создания сайта А. Иванова, Яндекс изменил алгоритм вылавливания спам-страниц, основанных на повторении запроса. Насколько я изучил его, основным критерием является расстояние между повторяющимися релевантными словами. Если оно слишком мало, вес таких слов сильно снижается. Возможно, если ключевых слов слишком много, URL страницы отсылается администратору, который решает, спам ли это, и может удалить страницу из базы.
Например, у меня на странице http://sadovsky.newmail.ru/bgates.htm в рассказе про Билла Гейтса я решил добавить ссылки на страницы с биографией Гейтса и юмором о нем. После этого релевантность страницы снизилась. Сравнение с идущими ниже в результатах страницами показало, что хотя число вхождений ключевых слов у меня выше, но у них слова рассеяны по всему тексту, а у меня идут подряд.
С уважением,
Александр Садовский.
А существует ли в природе программа, которая могла бы примерно спрогнозировать, по каким запросам какой поисковик сможет находить мой сайт? Например, программа анализирует все страницы сайта, соотношение ключевых слов и пр., его LP в конкретном поисковике, затем анализирует код страниц из top-10..50 поисковика по близким запросам и выдает прогноз?
Не совсем так. Точнее, может, Яндекс и учитывает предыдущие запросы, но разница в твоих результатах по другой причине. Если ты обратил внимание, то в первом случае поиск по слову "регистрация" дал URL:
http://www.yandex.ru/yandsearch?text=%F0%E5%E3%E8%F1%F2%F0%E0%F6%E8%FF
а когда запрос задавался со страницы с результатами поиска, то URL был
http://www.yandex.ru/yandsearch?yaca=1&text=%F0%E5%E3%E8%F1%F2%F0%E0%F6%E8%FF&stype=
Пустой параметр stype никак не влияет, а вот "yaca=1" и делает твою страницу первой. Можешь попробовать задать сразу запрос
http://www.yandex.ru/yandsearch?yaca=1&text=%F0%E5%E3%E8%F1%F2%F0%E0%F6%E8%FF
и увидишь, что твоя страница первая.
Что это за параметр "yaca", лучше спросить у Ильи. Явно не категории, т.к. они обозначаются "ctg". Скорее всего, что-то связанное с тем, "включены" ли категории. Судя по изменениям в форме выдачи результатов, параметр может принимать три значения "0", ">=1" и отсутствует.
N.B. Кстати, еще один запрос, по которому с первой страницы твой сайт первый -- "регистрация | Регистрация".
Что касается выдачи информации в зависимости от предыдущего запроса, я проверил, на запросах "летательный аппарат" vs "аппарат", "коробка передач" vs "коробка", "вычислительная машина" vs "машина" это не действует (по крайней мере в пределах первых 10 ссылок). Причем на эти запросы никак не влияет и параметр "yaca". Почему -- загадка Яндекса.
Вероятно, "yaca" как-то учитывает то, давно создана страница или нет, и новеньким повышает рейтинг. Это видно хотя бы потому, что разница в результатах поиска с "yaca"/без только в том, что наверху появляется твоя страница, все остальные ссылки остаются теми же.
[This message has been edited by funsad (edited 20-01-2001).]
Возможно, что эта страница является клоачной. Код, который я вижу по View | Source в браузере сильно отличается от кода, который сохраняет IE на диск по команде Save As.
Кроме того, я увидел в коде два необычных приема:
1) использование два и более раза тэга title в одном документе. Сомнительно, что это повышает релевантность во всех поисковиках -- мне кажется, результат очень сильно зависит от кода поисковика. И в большинстве случаев не должен давать ничего;
2) название каталога, в котором хранятся изображения, делается на русском и содержит ключевые слова (например, "Горные лыжи и сноуборды - Ваша ставка, господа ___files/").
Кто-нибудь может прокомментировать эффективность этих приемов? Распространенность?
Какие еще там приемы использованы, которых я не заметил?
Своим ответом я имел в виду, что методика такая же, как и при раскрутке любой англоязычной страницы — каталоги, поисковики, рейтинги, рассылки, баннеры и т.д. Поэтому ответ на твой вопрос есть почти в каждом разделе форума, и его невозможно вместить в один абзац. Если тебя интересует что-то конкретное — спрашивай.
Я не утверждаю, что Яндекс реагирует на множественные сабмиты, но замечу, что narod.ru — не показатель, так как для него в Яндексе выделен отдельный паук. И если уж и это насекомое начет привередничать...
Я думаю, их нужно выложить в интернет.
P.S. Каков вопрос, таков ответ.
Поздравляю!
Без глюков, правда, не обошлось -- началась путаница с датами. Если в разделе "Yandex, Rambler и другие поисковики Рунета" на главной странице указывается последняя дата сообщения 18.01.2001 17:07, то на деле оказывается 17.01.2001 23:05. Возможно, где-то есть и другие глюки.
Но это мелочи, что дальше? Какие движения души воплотятся в развитие сайта?
На некоторых сайтах есть подобные услуги — задаешь ключевое слово, URL, отмечаешь интересующие тебя поисковики из имеющегося списка и получаешь в ответ позицию твоего сайта. Например, на http://www.jimtools.com./position2.html можно "испытывать" таким образом 20 поисковиков, но только до 50 позиций с каждого. Если интересуют позиции в районе 1000, либо покупай платную версию, либо пиши свой скрипт.
Я еще наткнулся на парочку таких поисковиков. Первый -- по ресурсам Екатеринбурга:
http://www.sverdlovsk.ru/
точно индексирует (см. http://www.sverdlovsk.ru/about.html ). И второй -- по ресурсам Томска:
http://search.tomsk.ru/
Прямой информации об индексации нет, но похоже на то.