Да, совершенно верно. Но здесь рассматриваются технологии спамдексинга - и термины определяем применительно к нему.
А что, были сомнения? Народ начал разбегаться из инициативной группы?
Не волнуйся. Я тоже не отпаду. Но буду продолжать настаивать на двух моментах:
1. Если мы сбиваем некий документ, то для себя, а не для утверждения поисковиками (или оправдания перед ними). Мы не представляем собой силы, с которой поисковикам пришлось бы считаться, но мы уже - скажем так - фактор, который ими учитывается. А в позе просителя уважения к себе не добьешься.
2. Еще раз прошу - долой патетику. Этот документ (по моему мнению) имеет право на существование как "цеховой устав", а не "моральный кодекс строителя светлого будущего в сети". Чем меньше пышных деклараций, тем лучше.
Да, мы работаем за деньги. И в этом отношении ничем не отличаемся от всех остальных - сотрудники поисковиков тоже получают деньги за свою работу. И тоже стремятся заработать побольше. Так уж жизнь устроена - все красивое делается по зову души, а все полезное - по соображениям выгоды. Именно поэтому мы не "чистим от мусора" весь Рунет, а работаем в интересах заказчика. И собираем для себя свод правил - как нам работать, чтобы нас не смели обзывать "тараканьими малярами".
Это достаточно "сырая" заготовка - но, думаю, на то и коллектив, чтобы отшлифовать совместными усилиями...
Спамдексинг (он же "поисковый спам" или "обман поисковых систем"). Термин введен по аналогии с почтовым спамом и обозначает технологии, направленные на выдвижение ресурса на верхние позиции в результатах поиска без улучшения самого ресурса, а зачастую и в ущерб его информационному наполнению.
"Накачка ключевыми словами"
Наиболее старая из этих технологий заключается в некорректном наполнении мета-тэга keywords:
- словами, отсутствующими в тексте страницы, но относящимися к тематике ресурса;
- словами, отсутствующими в тексте и не относящимися к тематике. В любом случае эти слова относятся к популярным поисковым запросам;
- повторяющимися ключевыми словами.
Предполагается, что чем больше "нужных" слов, тем выше релевантность страницы по нужным запросам. Или по ненужным - если цель только в обеспечении посещаемости.
В этом случае имеет место и обман заказчика, которому демонстрируется как достижение большой приток нецелевых посетителей.
Эта практика настолько распространилась, что одни поисковые системы существенно снизили роль мета-тэга keywords в оценке релевантности, а другие вообще его игнорируют. Тем не менее, страницы с несоразмерно раздутым meta keywords встречаются по сей день.
Вариант - накачка текстового содержания страницы. В текст где только возможно вставляются "нужные" слова, от чего порой текст становится неудобочитаемым.
Чтобы "накачать" страницу ключевыми словами, не раздражая пользователя, используется ряд приемов, получивших название клоакинга (от англ. to cloak - скрывать). Суть этой технологии - в создании блоков текста, невидимого для пользователя, но доступного поисковику. Простейшие реализации:
- придать тексту цвет фона (или настолько близкий, чтобы текст был неразличим глазом);
- задать размер шрифта настолько мелкий, чтобы буквы оказались неразличимы;
- разместить текстовый блок на абсолютной позиции вне окна браузера (например, отрицательное значение позиции по вертикали);
- наложить поверх текстового блока рисунок (расположив его на абсолютной позиции, совпадающей с текстовым блоком)
Чаще всего эти приемы применяются совместно. Все они достаточно широко известны и наивно было бы считать, что они не поддаются определению - в том числе и алгоритмически. Более изощренный вариант клоакинга - динамическое формирование разных вариантов текста страницы для выдачи пользователю и поисковому роботу. В случае, если какой-либо из вариантов клоакинга не будет замечен поисковой машиной, бессмысленный текстовый блок все равно попадется на глаза пользователю в результатах поиска - в качестве "наиболее релевантного" фрагмента текста на странице.
/*
Именно таким образом - и, что прискорбно, с первых страниц выдачи - в мою коллекцию попали несколько образцов "текстов-невидимок". Среди них были такие спамерские "находки", как 9-кратное повторение тэга small для получения однопиксельного шрифта; громадный блок ключевых слов, пущенный "бегущей строкой"; тэг keywords=... (не мета-тэг!) и т.п.
Таким же образом был найден образец "улучшения" контента по-спамерски - статья, состоящая из фраз такого вида:
Что такое xxx?
xxx - это комфорт, надежность и уверенность...
xxx - это прекрасная возможность...
xxx - это великолепный сервис...
и так далее. Вместо xxx имел место популярный поисковый запрос. Просто "торжественный комплект" Остапа Бендера. :)
...и как этакое формализовать? Автор опуса охотно признАет, что стилист он никудышный, но не станет признавать, что это была преднамеренная накачка... Хотя приведи я статью "as is" - факт накачки был бы вполне очевиден.
*/
Энтузиасты в сборе. А скептика в команду возьмете? Я почти солидарен с Greenwood'ом в оценке необходимости этого кодекса. Он возможен - как своего рода кодекс чести.
Многословия обещать не могу, но... чем черт не шутит, вдруг смогу быть полезным. Хотя бы уже тем, что предложу отказаться от патетики. Не надо перепевать "манифест киберпанков" и провозглашать себя чем-то, декларируя служение идеалам.
Предлагаю определение:
Поисковая оптимизация - улучшение технических и контекстных характеристик ресурса в интересах его владельца. Цель оптимизации - приведение ресурса в состояние, отвечающее:
- техническим стандартам;
- наиболее вероятным ожиданиям пользователей в отношении информационного наполнения и удобства использования;
- лучшему соответствию критериям поисковых систем в отношении позиционирования в результатах поиска по запросам, относящимся к его тематике.
Пойдет в качестве вступительного взноса? По моему мнению, нужно плясать от определений - во избежание неразберихи. На optimization.ru определение звучит как "SEO - это оптимизация...".
Для каждого яда существует показатель LD50 - если мне память не изменяет, это сколько его нужно на килограмм живого веса, чтобы из партии подопытных зверушек гарантированно уморить не менее 50%. Это называется летальной дозой. И хотя всем понятно, что зверушки и обстоятельства бывают разные, этим обозначена грань возможности выживания. Это я так, для примера.
У этого форума есть правила. И хотя в общении тоже полно нюансов, но правила работают. То есть всегда можно выработать приемлемые нормы - если этого хочется.
А вот с поисковиками разговор о правилах действительно бесполезен. Много критериев придется оценивать и формализовать. А кто ж захочет это делать, когда в руках фактическая власть, обеспеченная монополией - все ведь и так хорошо. Гораздо легче спокойно пользоваться ситуацией, благо помешать всерьез никто не в силах.
И еще одно. С разрастанием сети у поисковиков нарастают проблемы. Девиз "найдется все" изначально наполовину лжив - найтись-то оно найдется, но где? Подразумевается, что именно в выдаче данного поисковика - а это далеко не всегда так. Чрезмерное увлечение "весовыми категориями" способно довести поиск до абсурда: у кого ИЦ выше, тот и релевантен запросу. Добавляем еще несколько "ноу-хау" и получаем ситуацию, когда ценную и редкую информацию найти НЕВОЗМОЖНО - вся выдача забита "околотематической" болтовней, зато размещена эта болтовня на "ценных и авторитетных" ресурсах. А ведь лежит где-то на невзрачном сайтике та самая, нужная и точная... но не найти ее. Потому что сайтик "ценности не представляет" - с точки зрения Его Неподкупности Алгоритма. И потому что слишком много этих ресурсов поразвелось - искать мешают...
Tony, а может быть лучше держаться поближе к реальности? Вы, похоже, не очень-то ее разглядели... Как по-Вашему, почему здесь присутствуют представители поисковиков? Почему они вообще с нами о чем-то разговаривают?
Здесь уже сложилось (пусть стихийно) сообщество оптимизаторов. И разговоры о "конкуренции между собой" не вполне отражают обстановку. Нет никаких боданий. Здесь не пинают всем миром новичка, а помогают ему советом, делятся информацией (порой редкой и труднодоступной), радуются успехам коллег, предлагают помощь. Загляните в "курилку", где звучат поздравления с первым заказом на оптимизацию. Пройдитесь в "любые вопросы от новичков" - удостоверьтесь. "Профсоюза" еще нет, до ассоциации с официальным статусом не дошло - но цех уже есть.
А "распределить ресурсы и бюджеты", порулить на рынке запросов... это, по-моему, отдает антинаучной фантастикой. :) Или Сухаревской конвенцией.
Светлана, в данном вопросе работы нет. :) Ни для теоретиков, ни, тем паче, для практиков. Оптимизация (если вдруг кто забыл) - это в переводе "улучшение". Так что просто есть оптимизация и есть спамдексинг. Есть оптимизаторы и есть спамеры. Терминология в наличии, просто не надо бы кое-кому подменять понятия и валить в одну кучу наших коллег и тех, с кем нам самим на одной стороне улицы находиться не хочется...
Мне вот начинать пришлось с того, что получил в работу напрочь заспамленный и забаненный сайт. И дооолго с ним мучался. На Олимп не вытолкал (да и не того ранга ресурс), но в порядок привел. Работает, причем честно. И после этого сваливание в одну кучу со спамерами для меня - плевок в глаза.
(сдержанный полупоклон в сторону Садовского)
Разумеется. Но речь о разбрасывании ссылок. А как составлен текст объявы, Алгоритму без разницы. Тому самому, тупому, но неподкупному. :)
Просто есть подозрения, что резкое возрастание количества ссылок на сайт - самое оно для обвинения в накрутке ИЦ. И алгоритмизуется без усилий...
Яндекс торжественно обещает за такие ссылки ИЦ не поднимать - см. http://www.yandex.ru/info/ci.html
А избыток усердия в разбрасывании этих ссылок может, чего доброго, воспринять как попытку "накрутки ТИЦ" - но это уже не заявления Яндекса, а мои опасения...
Контрольным взвешиванием. :)
Например, Мозиллой прикинется (чтобы не узнали по юзер-агенту) и зайдет через прокси (чтоб не узнали по IP-адресу). Может, я параноик... но мне кажется, нечто очень похожее я видел в httpd-access.log - и не раз. ;)
А потом сверит полученные версии страницы...