богоносец

богоносец
Рейтинг
777
Регистрация
30.01.2007
Могли ли из за метрики забанить сайт?
бот Щукин:
Решение об исключении страниц из поиска принимается алгоритмами в результате анализа совокупности многих факторов.

А белым и пушистым придётся смотреть: нет ли случайно метрики на том сайте, на который ссылаешься.js

И всякие подозрительные фичи типа блок «поделиться» не ставить, если всё хорошо. Месяца 3 назад сам счёл бы это паранойей, но похоже, что она давно есть у борцов со спамом.

loot:
заметьте, страница с размещенными фреймами не кешируется

А сделайте файл.html с <frameset> ... и добавьте в него html шапки от ПС, как они это делают.

Браузер такое показывать не обязан. И это просто глупость - Сохраненная копия - под сниппетом. А ПС в кэше и в .xml свою шапку пихали...

Сайтег на акуймах.

... в Я.сниппете видел текст, который из файла, указанного во фрейме, но не покажу. Ссылка из выдачи вела на документ, который не <body> с <iframe> а <frameset> ... это не одно и то же.

<html>

<head>
<title>...</title>
<meta name="description" content="...">
</head>
<frameset framespacing="1" cols="28%,*">
<frame name="leftFrame1" src="menu-links.htm" target="mainFrame1">
<frame name="mainFrame1" src="Content.htm">
<noframes>
<body>
<h2>Без фреймов не работает!</h2>
</body>
</noframes>
</frameset>
</html>
Sower:
и подгружал фреймом блок, где тошнит от ключей

Ну в скрипты это завернуть слегка... только не тупо в document.write а функцию какую...

Тегов <h1> может быть более 10. Спросите у Яндекса... и посмотрите в код демки, написанной после подобной темы месяцев 15 назад.

Всяких <h2>...<h6> и <p> можно не употреблять.

Не забываем повтор запроса в урле, на иконке :) и в тайтле (в читабельных фразах).

Когда вы стеснительно соображаете: 1 или 2 АшОдына?.. то с т.з. матрикснета ваша страница с бОльшей вероятностью оказывается похожей на большинство других. А когда в ней что-то самое обычное запредельно зашкаливает, то ... совсем не обязательно это спам, просто её может типа не получиться так же просто классифицировать.

Е.ОСЕТИСНКАЯ: ... если искать что-то более сложное по экономике или по медицине... там будет еще по медицине какой-нибудь «Mail.lady.ry», и там будет полная ерунда
И.СЕГАЛОВИЧ: ... выделить истинный, качественный, хороший авторский контент трудно по одной простой причине – для того, чтобы его выделить, надо, чтобы люди, которые смотрят на него, оценивают его, они хорошо в нем разбирались. Это просто очень дорого сделать.
zagred:
Похоже, тетка поисковик с энциклопедией перепутала.

Тётка, даже не разбираясь в теме, может легко отличить некачественный контент... а программер так говорит, что становится понятно, что и отдалённой задачи такой перед собой не ставит.

platon-777:
После IPO я думаю денег достаточно появилось у Яндекса.

У массового сервиса есть предрасположенность в сторону всего популярного... не требующего существенных вложений. Это обстоятельство и побеждает.

anthony_:
Если при анализе страниц поисковые анализаторы определят, что большинство из этих страниц спамные

Это слишком человеческий язык.

Решительным и определяющим является то, какую ВЫ деятельность ведете с сайтом.

Определяющим окажется НЕ ваша деятельность... а то, как она увидится простецким таким алгоритмам. Уже два примера имею без продажных сцылок, и на незначительных сайтах пробую повторить ту же последовательность действий, протоколируя их...

... раньше (на человеческом языке) померещилось:

  • Сайты выкидываются из индекса по подозрению.
  • Важна сумма или некая комбинация подозрений.
  • Автоматические подозрения возникают по совсем примитивным признакам, поэтому их и не получается сформулировать.
  • Фильтр работает не быстро, могут пройти месяцы... поэтому, если действий было несколько, не получается угадать, что именно привело к превышению некоторого предела.
Платон Щукин:
мы стараемся не индексировать или не ранжировать высоко страницы, содержащие текст, предназначенный не для пользователей, а исключительно для продвижения страницы в поисковых машинах. Например, это могут быть списки поисковых запросов (многократное повторение и перечисление ключевых слов и фраз), в том числе скрытые от глаз пользователей при помощи различных технических приемов

Врёт. Запрос тег h1 h1-h1-h1-h1-h1.narod.ru › H1/h1.xml на грани топа10, демка для бредотем. Посчитайте количество повторов в тайтле, 7 слов h1, + всё это завуалированный список поисковых запросов, + в браузере видно не тот тайтл, что видит бот, + <h1> заменяется на <p> но текст почти человеческий.

Вывод: ихние алгоритмы действуют не так, как вещают платоны... и придётся их изучать, хотя яндексоиды этого и не хотели бы.

У матрикснето-образных фильтровалок местами может быть доля ошибок, которую заранее подсчитать не получится, и потом не получится — по причине слишком большого их количества. Зато всем можно автоответить про несоответствие вашего говна божественно правильным представлениям ихних алгоритмов.

По ашмановскому анализатору в выдаче до 4% явного спама (по очень консервативному списку признаков), в действительности больше, если считать ещё и всякую псевдо-инфу. Угадайте: какой % правильных сайтов яндексоиды согласны ошибочно счесть спамом?.. пока борятся с тем, что надо было побороть ещё лет 10 назад. Современного спама в упор не видят.

Shessmaster:
Поисковой системе Яндекс абсолютно все рано, стоят на сайте ссылки или статьи с sape.ru или нет.

Не всё равно.

Для них существенен один момент - интересен ваш сайт пользователю...

Скажите простому программисту: как это выразить в коде?

А то, когда им простые журналюги указывают на очевидную для нормальных людей проблему, они отвечают, что её решить трудно:

Е.ОСЕТИСНКАЯ: У меня не только к вам, но и ко всем поисковикам есть одна претензия. Когда я ищу, допустим, ангорских кошек, там все в порядке, они находятся и с ними все хорошо. А если искать что-то более сложное по экономике или по медицине, в лучшем случае, вам вывалится пять миллионов ответов, там будет обязательно ответ из «Википедии», там будет еще по медицине какой-нибудь «Mail.lady.ry», и там будет полная ерунда, а мне пять миллионов эти не нужно. Я хочу, чтобы мне выдали правильный ответ, я спрашиваю умных, вы мне, пожалуйста, выдайте ответ, чтобы он был исчерпывающим. А ни один поисковик такого не делает. Почему?

И.СЕГАЛОВИЧ: Довольно сложно отличить контент качественный от… Истинно оригинальный, авторский, хороший контент от среднего контента «Mail.lady.ry». Что мы хорошо научились делать – мы научились хорошо отличать спам от не-спама. За этим мы как-то более-менее следим, это для нас очень важный показатель, мы стараемся, там выбрасывать. А вот выделить истинный, качественный, хороший авторский контент трудно по одной простой причине – для того, чтобы его выделить, надо, чтобы люди, которые смотрят на него, оценивают его, они хорошо в нем разбирались. Это просто очень дорого сделать.

http://www.echo.msk.ru/programs/dozor/751913-echo/

Так что хватит тут рассуждать как люди... ботов делают иначе.

ps и про умение «хорошо отличать спам от не-спама» в % ошибок следовало бы, а не в «хорошо». Кто же скажет, что делает это плохо. А уж про неумение распознавать современные виды почти-спама... ещё лет несколько будут молчать.

Eriko:
Все зависит от вашего сайта. Если у вас действительно сайт для людей, то продажа ссылок и статей в разумных объемах никак не скажется на вашем сайте.

Когда-то давно... нормальные люди научились одевать т.н. богов в человеческие представления. Оптимизаторы так же поступают с API... чему создатели не мешают, преследуя, однако, несколько другие цели.

Может быть ещё скажите, что они и ранжируют по релевантности запросам ползателей?

Aleksanderrr:
Платон ответил:

Это автоответчик. И далее будет он же.

Avangardman:
если уж 0 страниц, то не АГС, а бан

А если после этого появляется 10% страниц в индексе, тогда что это было?

master_jeday:
писать длинные тайтлы, которые не помещаются в серпе, не целесоообразно

Есть же пределы, в которых сколько-то помещается. И выглядит приемлемо и в гугле как-то, и может быть НК.

Хоть иногда заглядывайте в html показываемых примеров...

Denisg:
Но, согласитесь, гораздо приятнее было бы видеть сайт:

Учебник CSS для начинающих. Способы внедрения в HTML документ.

Это надо проверять на реальных искателях... они не всегда действуют так, как кажется.

dedylin:
7 повторов в тайтле — не спам. А высший пилотаж по топом 500 -10000

Не обязательно.

У всяких матрикснетов типа образное восприятие... «хороший» от «плохого» различают не только по количеству чего-то в документе, а по некоторой комбинации признаков, остающихся неизвестными. И эта комбинация может быть как у «хорошего» ответа и при почти спаме в тайтле, и как у «плохого» — при отсутствии спама в любой части документа.

Поэтому уже давно бессмысленны крики типа: «У конкурентов ещё больше!»

Всего: 13677