funsad

Рейтинг
116
Регистрация
15.11.2000

<font face="Verdana" size="2">Originally posted by AiK:
Александр, Вы, как я вижу, очень любите читать документации, ФАКи и прочие форумы,</font>

Не сколько люблю, сколько иногда это помогает.

<font face="Verdana" size="2">не могли бы Вы привести ссылочки по теме спама в Яндексе?</font>

Нет проблем. Для получения большей части ссылок достаточно воспользоваться самим Яндексом:

1. Яндекс: Раздел помощи. Советы вебмастеру-5

Спам, или не нужно обманывать пользователя
Спам - это заголовки и ключевые слова, сдобренные большим количеством слов из самых популярных запросов, большие массивы текста, "написанные" на странице цветом фона или очень мелким шрифтом, а также многие другие уловки с целью привлечения пользователя на свои страницы обманом.
Их не стоит применять по двум причинам. Во-первых, это не добавляет славы создателю страниц и вызывает естественное раздражение пользователей. Во-вторых, Яndex отслеживает такие ненормальные изменения и снижает место документа на странице результатов. Кроме этого, спам увеличивает размер документа и, следовательно, уменьшает контрастность слов в нем, что также влияет на место документа в списке найденного. В случаях злостного использования спама администрация Яndex может исключить такие страницы и сайты из базы.
Страницы со временем перенаправления на другие страницы (redirect) равным нулю также исключаются из индексирования.

2. Яндекс: Раздел помощи. Советы вебмастеру-3

Если слово из основного текста документа не расценено как спам и есть в "keywords" среди первых 50, то вес этого слова в запросе повышается ... Яndex может посчитать слишком частотные слова спамом.

3. Яндекс-сказка 19: "Яndex - search & research engine"

Некоторые веб-мастера всеми правдами и неправдами пытаются попасть на первую страницу выдачи поисковой машины. Их можно понять, но очень жалко пользователей, которые ищут какую-то важную информацию, а находят страницу такого спамера. Начиная с недавнего времени мы начали бороться с таким "популизмом". У спамерских страниц теперь понижается релевантность, то есть они находятся, но не "в первых рядях", а значительно дальше.

4. Яндекс-сказка 16: Star Wars. Новый Яndex - Борьба с хаосом.

Спам - это заголовки и ключевые слова, сдобренные большим количеством самых популярных запросов, большие массивы текста, "написанные" на странице цветом фона или очень мелким шрифтом, а также многие другие уловки с целью привлечения пользователя на свои страницы обманом. Многие попадались на эту хитрую приманку. Яndex отслеживает такие ненормальные изменения и снижает место документа на странице результатов.

5. Форум Яндекса: спамерские страницы

Мы на Yandex'е уже начали бороться со спамом, пока мягко - просто понижаем в рейтинге "спамовые" страницы. Кстати, для построения портрета спама используем meta-тэги.

6. Форум Яндекса: Поисковый спам

Мы боремся со спамом. Возможно недостаточно эффективно. Меры воздействия принимаются.

<font face="Verdana" size="2">Потому как если это
http://promotion.mt.ru/pd/registraciya_sayta_v_poiskovykh_sistemakh.html
не спам, то я трамвайная остановка.
Да, на странице редирект жабный, так что аккуратнее. А страница на первом месте по фразе "регистрация сайта".
</font>

Артем, дело не в том, спам это или нет, дело в том, знает о нем команда Яндекса, или нет. Массовое и последовательное обнаружение, на мой взгляд, возможно только в двух случаях:

- метод "стукачества";

- метод автоматического анализа страницы на спам. Если она попадает в "группу риска" по спаму, то, скорее всего, сразу снижается ее рейтинг и, если ручная проверка выявит спам, страница исключается из базы.

Так как кампании по вербовке стукачей, насколько я знаю, Яндекс еще не предпринимал, следовательно, им остается полагаться на анализ. И, вполне возможно, алгоритм не учитывает не все виды редиректов через JavaScript. Напишите Яндексу, и спама станет меньше.

С уважением,

Александр Садовский.

<font face="Verdana" size="2">Originally posted by AiK:
Блин, страница из Яндекса вообще делась </font>

Почему же, основная страница http://about.al.ru/autosubmitter.html в базе есть, а входная (я не помню ее адрес)... Значит ее сочли спамом.

После создания сайта А. Иванова, Яндекс изменил алгоритм вылавливания спам-страниц, основанных на повторении запроса. Насколько я изучил его, основным критерием является расстояние между повторяющимися релевантными словами. Если оно слишком мало, вес таких слов сильно снижается. Возможно, если ключевых слов слишком много, URL страницы отсылается администратору, который решает, спам ли это, и может удалить страницу из базы.

Например, у меня на странице http://sadovsky.newmail.ru/bgates.htm в рассказе про Билла Гейтса я решил добавить ссылки на страницы с биографией Гейтса и юмором о нем. После этого релевантность страницы снизилась. Сравнение с идущими ниже в результатах страницами показало, что хотя число вхождений ключевых слов у меня выше, но у них слова рассеяны по всему тексту, а у меня идут подряд.

С уважением,

Александр Садовский.

А существует ли в природе программа, которая могла бы примерно спрогнозировать, по каким запросам какой поисковик сможет находить мой сайт? Например, программа анализирует все страницы сайта, соотношение ключевых слов и пр., его LP в конкретном поисковике, затем анализирует код страниц из top-10..50 поисковика по близким запросам и выдает прогноз?

С уважением,

Александр Садовский.

<font face="Verdana" size="2">Originally posted by AiK:
Раз пять повторил, результат один и тот же. Т.е. наши хитрецы похоже учитывают предыдущие запросы?</font>

Не совсем так. Точнее, может, Яндекс и учитывает предыдущие запросы, но разница в твоих результатах по другой причине. Если ты обратил внимание, то в первом случае поиск по слову "регистрация" дал URL:

http://www.yandex.ru/yandsearch?text=%F0%E5%E3%E8%F1%F2%F0%E0%F6%E8%FF

а когда запрос задавался со страницы с результатами поиска, то URL был

http://www.yandex.ru/yandsearch?yaca=1&text=%F0%E5%E3%E8%F1%F2%F0%E0%F6%E8%FF&stype=

Пустой параметр stype никак не влияет, а вот "yaca=1" и делает твою страницу первой. Можешь попробовать задать сразу запрос

http://www.yandex.ru/yandsearch?yaca=1&text=%F0%E5%E3%E8%F1%F2%F0%E0%F6%E8%FF

и увидишь, что твоя страница первая.

Что это за параметр "yaca", лучше спросить у Ильи. Явно не категории, т.к. они обозначаются "ctg". Скорее всего, что-то связанное с тем, "включены" ли категории. Судя по изменениям в форме выдачи результатов, параметр может принимать три значения "0", "&gt;=1" и отсутствует.

N.B. Кстати, еще один запрос, по которому с первой страницы твой сайт первый -- "регистрация | Регистрация".

Что касается выдачи информации в зависимости от предыдущего запроса, я проверил, на запросах "летательный аппарат" vs "аппарат", "коробка передач" vs "коробка", "вычислительная машина" vs "машина" это не действует (по крайней мере в пределах первых 10 ссылок). Причем на эти запросы никак не влияет и параметр "yaca". Почему -- загадка Яндекса.

Вероятно, "yaca" как-то учитывает то, давно создана страница или нет, и новеньким повышает рейтинг. Это видно хотя бы потому, что разница в результатах поиска с "yaca"/без только в том, что наверху появляется твоя страница, все остальные ссылки остаются теми же.

С уважением,

Александр Садовский.

[This message has been edited by funsad (edited 20-01-2001).]

<font face="Verdana" size="2">Originally posted by AiK:
Да вёрстка тут ни причём.
Посмотри на исходник. Глядя на страницу, ты увидишь словосочетание "горные лыжи" 2 раза, а на самом деле (т.е. то что будет увидено поисковиком) - оно встречается семь раз. Притом при всём, что слов всего не больше сотни.
</font>

Возможно, что эта страница является клоачной. Код, который я вижу по View | Source в браузере сильно отличается от кода, который сохраняет IE на диск по команде Save As.

Кроме того, я увидел в коде два необычных приема:

1) использование два и более раза тэга title в одном документе. Сомнительно, что это повышает релевантность во всех поисковиках -- мне кажется, результат очень сильно зависит от кода поисковика. И в большинстве случаев не должен давать ничего;

2) название каталога, в котором хранятся изображения, делается на русском и содержит ключевые слова (например, "Горные лыжи и сноуборды - Ваша ставка, господа ___files/").

Кто-нибудь может прокомментировать эффективность этих приемов? Распространенность?

Какие еще там приемы использованы, которых я не заметил?

С уважением,

Александр Садовский.

[This message has been edited by funsad (edited 20-01-2001).]

<font face="Verdana" size="2">Originally posted by bester7:
funsad ты не понял вопрос,а уже пишешь ответ. Страницы уже в интернете.Вопрос в том,как их разрекламировать и желательно американцам.</font>

Своим ответом я имел в виду, что методика такая же, как и при раскрутке любой англоязычной страницы&nbsp;&#151; каталоги, поисковики, рейтинги, рассылки, баннеры и т.д. Поэтому ответ на твой вопрос есть почти в каждом разделе форума, и его невозможно вместить в один абзац. Если тебя интересует что-то конкретное&nbsp;&#151; спрашивай.

<font face="Verdana" size="2">Originally posted by AiK:
Дальше, что бы проверить второе утверждение, надо выполнить несколько запросов к поисковику. Если в певрой десятке будут попадаться халявные домены, то система никак не реагирует на множественные сабмиты. Например в Яндексе на превых позициях встречаются сайты с narod.ru</font>

Я не утверждаю, что Яндекс реагирует на множественные сабмиты, но замечу, что narod.ru&nbsp;&#151; не показатель, так как для него в Яндексе выделен отдельный паук. И если уж и это насекомое начет привередничать...

С уважением,

Александр Садовский.

<font face="Verdana" size="2">Originally posted by bester7:
У меня есть несколько страниц на английском языке с рекламмой продукции.
Как сделать,чтобы больше людей(желательно американцев) смогло увидеть их?
</font>

Я думаю, их нужно выложить в интернет.

P.S. Каков вопрос, таков ответ.

<font face="Verdana" size="2">Originally posted by Gray:
Все, наконец-то. Мы на собственном хостинге и со своим доменом!</font>

Поздравляю!

Без глюков, правда, не обошлось -- началась путаница с датами. Если в разделе "Yandex, Rambler и другие поисковики Рунета" на главной странице указывается последняя дата сообщения 18.01.2001 17:07, то на деле оказывается 17.01.2001 23:05. Возможно, где-то есть и другие глюки.

Но это мелочи, что дальше? Какие движения души воплотятся в развитие сайта?

<font face="Verdana" size="2">Originally posted by Flex:
Как узнать что, допустим, мой сайт по запросу "board" записан в AV или Google или по этому запросу моей странички нет?
Если он прописан но занимает 1000 позиция в ручную не узнать и вообще это бессмысленно.
Или вы тоже никто не знаете?
</font>

На некоторых сайтах есть подобные услуги&nbsp;&#151; задаешь ключевое слово, URL, отмечаешь интересующие тебя поисковики из имеющегося списка и получаешь в ответ позицию твоего сайта. Например, на http://www.jimtools.com./position2.html можно "испытывать" таким образом 20 поисковиков, но только до 50 позиций с каждого. Если интересуют позиции в районе 1000, либо покупай платную версию, либо пиши свой скрипт.

С уважением,

Александр Садовский.

Всего: 1503