Не сколько люблю, сколько иногда это помогает.
Нет проблем. Для получения большей части ссылок достаточно воспользоваться самим Яндексом:
1. Яндекс: Раздел помощи. Советы вебмастеру-5
Спам, или не нужно обманывать пользователяСпам - это заголовки и ключевые слова, сдобренные большим количеством слов из самых популярных запросов, большие массивы текста, "написанные" на странице цветом фона или очень мелким шрифтом, а также многие другие уловки с целью привлечения пользователя на свои страницы обманом.Их не стоит применять по двум причинам. Во-первых, это не добавляет славы создателю страниц и вызывает естественное раздражение пользователей. Во-вторых, Яndex отслеживает такие ненормальные изменения и снижает место документа на странице результатов. Кроме этого, спам увеличивает размер документа и, следовательно, уменьшает контрастность слов в нем, что также влияет на место документа в списке найденного. В случаях злостного использования спама администрация Яndex может исключить такие страницы и сайты из базы.Страницы со временем перенаправления на другие страницы (redirect) равным нулю также исключаются из индексирования.
2. Яндекс: Раздел помощи. Советы вебмастеру-3
Если слово из основного текста документа не расценено как спам и есть в "keywords" среди первых 50, то вес этого слова в запросе повышается ... Яndex может посчитать слишком частотные слова спамом.
3. Яндекс-сказка 19: "Яndex - search & research engine"
Некоторые веб-мастера всеми правдами и неправдами пытаются попасть на первую страницу выдачи поисковой машины. Их можно понять, но очень жалко пользователей, которые ищут какую-то важную информацию, а находят страницу такого спамера. Начиная с недавнего времени мы начали бороться с таким "популизмом". У спамерских страниц теперь понижается релевантность, то есть они находятся, но не "в первых рядях", а значительно дальше.
4. Яндекс-сказка 16: Star Wars. Новый Яndex - Борьба с хаосом.
Спам - это заголовки и ключевые слова, сдобренные большим количеством самых популярных запросов, большие массивы текста, "написанные" на странице цветом фона или очень мелким шрифтом, а также многие другие уловки с целью привлечения пользователя на свои страницы обманом. Многие попадались на эту хитрую приманку. Яndex отслеживает такие ненормальные изменения и снижает место документа на странице результатов.
5. Форум Яндекса: спамерские страницы
Мы на Yandex'е уже начали бороться со спамом, пока мягко - просто понижаем в рейтинге "спамовые" страницы. Кстати, для построения портрета спама используем meta-тэги.
6. Форум Яндекса: Поисковый спам
Мы боремся со спамом. Возможно недостаточно эффективно. Меры воздействия принимаются.
Артем, дело не в том, спам это или нет, дело в том, знает о нем команда Яндекса, или нет. Массовое и последовательное обнаружение, на мой взгляд, возможно только в двух случаях:
- метод "стукачества";
- метод автоматического анализа страницы на спам. Если она попадает в "группу риска" по спаму, то, скорее всего, сразу снижается ее рейтинг и, если ручная проверка выявит спам, страница исключается из базы.
Так как кампании по вербовке стукачей, насколько я знаю, Яндекс еще не предпринимал, следовательно, им остается полагаться на анализ. И, вполне возможно, алгоритм не учитывает не все виды редиректов через JavaScript. Напишите Яндексу, и спама станет меньше.
С уважением,
Александр Садовский.
Почему же, основная страница http://about.al.ru/autosubmitter.html в базе есть, а входная (я не помню ее адрес)... Значит ее сочли спамом.
После создания сайта А. Иванова, Яндекс изменил алгоритм вылавливания спам-страниц, основанных на повторении запроса. Насколько я изучил его, основным критерием является расстояние между повторяющимися релевантными словами. Если оно слишком мало, вес таких слов сильно снижается. Возможно, если ключевых слов слишком много, URL страницы отсылается администратору, который решает, спам ли это, и может удалить страницу из базы.
Например, у меня на странице http://sadovsky.newmail.ru/bgates.htm в рассказе про Билла Гейтса я решил добавить ссылки на страницы с биографией Гейтса и юмором о нем. После этого релевантность страницы снизилась. Сравнение с идущими ниже в результатах страницами показало, что хотя число вхождений ключевых слов у меня выше, но у них слова рассеяны по всему тексту, а у меня идут подряд.
А существует ли в природе программа, которая могла бы примерно спрогнозировать, по каким запросам какой поисковик сможет находить мой сайт? Например, программа анализирует все страницы сайта, соотношение ключевых слов и пр., его LP в конкретном поисковике, затем анализирует код страниц из top-10..50 поисковика по близким запросам и выдает прогноз?
Не совсем так. Точнее, может, Яндекс и учитывает предыдущие запросы, но разница в твоих результатах по другой причине. Если ты обратил внимание, то в первом случае поиск по слову "регистрация" дал URL:
http://www.yandex.ru/yandsearch?text=%F0%E5%E3%E8%F1%F2%F0%E0%F6%E8%FF
а когда запрос задавался со страницы с результатами поиска, то URL был
http://www.yandex.ru/yandsearch?yaca=1&text=%F0%E5%E3%E8%F1%F2%F0%E0%F6%E8%FF&stype=
Пустой параметр stype никак не влияет, а вот "yaca=1" и делает твою страницу первой. Можешь попробовать задать сразу запрос
http://www.yandex.ru/yandsearch?yaca=1&text=%F0%E5%E3%E8%F1%F2%F0%E0%F6%E8%FF
и увидишь, что твоя страница первая.
Что это за параметр "yaca", лучше спросить у Ильи. Явно не категории, т.к. они обозначаются "ctg". Скорее всего, что-то связанное с тем, "включены" ли категории. Судя по изменениям в форме выдачи результатов, параметр может принимать три значения "0", ">=1" и отсутствует.
N.B. Кстати, еще один запрос, по которому с первой страницы твой сайт первый -- "регистрация | Регистрация".
Что касается выдачи информации в зависимости от предыдущего запроса, я проверил, на запросах "летательный аппарат" vs "аппарат", "коробка передач" vs "коробка", "вычислительная машина" vs "машина" это не действует (по крайней мере в пределах первых 10 ссылок). Причем на эти запросы никак не влияет и параметр "yaca". Почему -- загадка Яндекса.
Вероятно, "yaca" как-то учитывает то, давно создана страница или нет, и новеньким повышает рейтинг. Это видно хотя бы потому, что разница в результатах поиска с "yaca"/без только в том, что наверху появляется твоя страница, все остальные ссылки остаются теми же.
[This message has been edited by funsad (edited 20-01-2001).]
Возможно, что эта страница является клоачной. Код, который я вижу по View | Source в браузере сильно отличается от кода, который сохраняет IE на диск по команде Save As.
Кроме того, я увидел в коде два необычных приема:
1) использование два и более раза тэга title в одном документе. Сомнительно, что это повышает релевантность во всех поисковиках -- мне кажется, результат очень сильно зависит от кода поисковика. И в большинстве случаев не должен давать ничего;
2) название каталога, в котором хранятся изображения, делается на русском и содержит ключевые слова (например, "Горные лыжи и сноуборды - Ваша ставка, господа ___files/").
Кто-нибудь может прокомментировать эффективность этих приемов? Распространенность?
Какие еще там приемы использованы, которых я не заметил?
Своим ответом я имел в виду, что методика такая же, как и при раскрутке любой англоязычной страницы — каталоги, поисковики, рейтинги, рассылки, баннеры и т.д. Поэтому ответ на твой вопрос есть почти в каждом разделе форума, и его невозможно вместить в один абзац. Если тебя интересует что-то конкретное — спрашивай.
Я не утверждаю, что Яндекс реагирует на множественные сабмиты, но замечу, что narod.ru — не показатель, так как для него в Яндексе выделен отдельный паук. И если уж и это насекомое начет привередничать...
Я думаю, их нужно выложить в интернет.
P.S. Каков вопрос, таков ответ.
Поздравляю!
Без глюков, правда, не обошлось -- началась путаница с датами. Если в разделе "Yandex, Rambler и другие поисковики Рунета" на главной странице указывается последняя дата сообщения 18.01.2001 17:07, то на деле оказывается 17.01.2001 23:05. Возможно, где-то есть и другие глюки.
Но это мелочи, что дальше? Какие движения души воплотятся в развитие сайта?
На некоторых сайтах есть подобные услуги — задаешь ключевое слово, URL, отмечаешь интересующие тебя поисковики из имеющегося списка и получаешь в ответ позицию твоего сайта. Например, на http://www.jimtools.com./position2.html можно "испытывать" таким образом 20 поисковиков, но только до 50 позиций с каждого. Если интересуют позиции в районе 1000, либо покупай платную версию, либо пиши свой скрипт.