Это то, что называется "нечеткий дубль". То есть, когда страница в целом вроде бы и уникальна, но состоит из кусочков, которые уже где-то встречаются на сайте.
Вот что я заметил на практике (на своих сайтах) по этому поводу. Есть новости, которые в духе WordPress показываются анонсами в категориях, откуда и идет ссылка на полный текст новости. Так как новости очень узко-специализированные, страница категории ВСЕГДА получается более тематичной, чем отдельная запись - хотя бы из-за заголовков, которые корректирую так, чтобы включали варианты ключевого запроса (за тем, собственно, и "новости" эти держу). Но Гугол НИКОГДА не показывает эти страницы категорий выше, чем сами записи в них - хотя записи по части контента скорее УГ, чем тексты.
На мой взгляд, это происходит исключительно потому, что запись, хоть и плохая, содержит не-дублированный текст, а вот страницы категорий почти полностью состоят из нечетких дублей. Более, чем уверен: если саму новость давать не буду (то есть, ее не будет вообще, только ее анонс в категории) - тогда страницы категорий будут гораздо лучше показываться. Но по числу их будет в 10 раз меньше (у меня ровно по 10 штук анонсов на странице).
Это лучшее, что можно сделать! Только не сбоку и не снизу. Я бы сказал, каждый сайт должен начинаться с того, что НА САМОМ ЦЕННОМ месте (вверху главной страницы) располагался бы уникальный, насыщенный важнейшими для сайта ключевыми фразами, кусок текста килобайта в 2...4, о чем же этот сайт и что на нем есть. А в идеале - и для каждой страницы так: о чем именно эта страница сайта.
Это никак не портит внешний вид, и для пользователя крайне полезно: он сразу видит, куда попал и что сейчас ему предстоит прочесть. Ну, к примеру: если компания продает ноутбуки, то на странице "Ноутбуки от Acer" логично сначала рассказать, чем известна фирма Acer и какие хорошие ноутбуки она производит, какие ценовые ниши занимают, ниже же - ссылки на страницы с описанием каждой модели. А на странице описания товара сначала рассказать, чем же так хорош данный конкретный ноутбук, кому его лучше купить: студенту ли с очень ограниченным бюджетом, или крупному бизнесмену, для которого престижность модели дороже денег, а затем дать крупное фото, технические характеристики, цену и скидки. Помимо SEOшной выгоды, это явно простимулирует покупателя к действию, ибо он уже усвоил из текста, что только последний дебил не купит такой замечательный ноут по столь привлекательной цене, да еще от такого хорошего производителя (об этом он узнал с предыдущей страницы). Если текст, конечно, составлен социально-верно - а то многие вместо того, чтобы хвалить товар, на таких страницах хвалят себя ("мы предлагаем", "у нас Вы можете купить", "мы поставляем лучшие модели" ...). Да не "мы предлагаем", а "посмотрите, какой оптимальный по цене и производительности, проверенный временем тип процессора в этой машине!" (это если надо продать никому не нужное старье).
Почему же Интернет-магазины не часто так делают? Только потому, что эти тексты надо писать самим; и в меньшей степени - потому, что не знают, как их встроить в CMS. Вот и получают страницы товара в большом количестве, на которых, кроме фотки, есть от силы один абзац полностью скопированного с других сайтов текста с характеристиками. Которые Гугол совершенно справедливо тоннами выкидывает в "сопли", ибо ценности они в основной выдаче не представляют.
------------------------
Willie добавил 05.01.2010 в 15:17
Кстати, это момент на самом деле существенный (речь не только о редиректе, но и вообще).
В некоторых случая, особенно если касается смены URL, первое время придется вообще без траффика посидеть (если он шел по НЧ с "внутряков). На мой взгляд, это сравнимо с несложной хирургической операцией, например, удалением аппендицита: да, придется недельку поваляться в больнице, но зато потом пациент выйдет здоровым. Если же такое воспаление пытаться перенести "на ногах", то кончится той же больницей, только в тяжелой и очень опасной форме, а то и моргом.
Конечно, в целом Богоносец прав. Но он пишет как доктор доктору (продолжая врачебную тематику), типа "коллега, а вот в данном случае анализ крови показывает...". А пациент-то это поймет? У него на ноге какое-то непонятное воспаление, и ходить больно. Ему нужны не наши рассуждения, на какой странице такой-то профессор описал эти симптомы, а рецепт, чтобы пойти в аптеку, купить эти таблетки и пить три раза в день по две штуки. И не пять раз в день по пачке, и не по стакану горилки вместо таблеток - а именно так.
--------------------------
Willie добавил 05.01.2010 в 15:43
Похоже на тот редкий случай, когда действительно уместно говорить о "фильтре". Нечасто такое бывает, что даже главную страницу Гугол отправляет в "сопли". Либо еще его алгоритмы что-то не обсчитали до конца (в таком случае сайт появится в выдаче) - но это маловероятно.
На главную, разумеется, надо поставить какой-нибудь контент, кроме ссылок. У части важнейших страниц (из левого меню) мета DESCRIPTION никуда не годятся, и Гугол их таковыми не воспринимает. Например, страница про адаптеры:
<meta name='description' content='Адаптеры - - Linksys.in.ua' />
Да и TITLE тоже плохенькие, но вернемся к описаниям. Есть еще одна версия, но здесь я не уверен, что именно из-за этого такое отношение Гугла: Вы в мета используете одинарные кавычки. Замените их на двойные. От этого хуже точно не станет, а будет правильнее. Имею ввиду, сделать у того же описания вот так:
<meta name="description" content="Адаптеры - - Linksys.in.ua" />
Вы знаете, примерно такое уже давно имею на одном сайте. Сайт сначала был "хорошим", то есть, Гугол к нему относился нормально - и показывался он лучше именно по США (нацелен был туда + много региональных ключевиков). На подходе к ТОПу его просто разнесли путем копирования контента на бесчисленные тематические блоги, Гугол сайт разлюбил, и теперь показывает его гораздо выше во всяких Польшах, Италиях, Саудовских Аравиях и т.п. - во всяком случае, траффик в основном идет оттуда, - чем в США.
Казалось бы, не логично, да? Но можно посмотреть и по-другому. Например, запрос "автострахование в Нью-Джерси": ну с какой стати Гуглу хорошо показывать мой сайт, когда по сравнению с ним есть десяток лучших именно по этому региону + еще есть супер-корпорации, которые везде показываются высоко? А вот для Польши эти региональные сайты проигрывают моему, так как поляку (по логике Гугла) все равно, Нью-Джерси это, или Ванкувер, или вообще Катманду. Мне кажется, как-то так можно объяснить ситуацию, хотя коряво сформулировал, что хотел сказать.
ОК, не лезу. Но обратите внимание - это Вы, я не я, пишете сюда с сакраментальным вопросом "помогите разобраться". :)
Вы сказали "равнодушие"? О, нет! Гугол к этому сайту отнюдь не равнодушен: из 2010 страниц в индексе к участию в поиске допущены лишь 14. Это ли "равнодущие" Гугла?!
... а Вы на главную страницу поставьте хотя бы немножко УНИКАЛЬНОГО контента (а не частичных копий с других страниц сайта), да перестаньте спамить в <H1>. Да еще так... можно в <h> заключить ссылку, но не в анкоре же это прописывать!
И не думайте, что на этом все закончено. Это так, для начала...
-------------------
Willie добавил 04.01.2010 в 20:09
Видимо, сайт недавно в Сети, раз "гугл видит хорошо". Подождите, разберется со временем - и тогда сами не сможете его найти, свой "сайт".
Чтобы Вас не обижать, я просто промолчу по поводу подобных сайтов. Реклама справа, реклама слева, реклама снизу, реклама справа... а что же в центре? Три cтроки контента на главной. Отчего же и туда не запихнули рекламных ссылок?
Ваше собственное отношение к этому сайту видно невооруженным глазом: "срубить бабла по-легкому". Или Вы несете людям что-то новое, связанное с векторной графикой?
------------------
Willie добавил 04.01.2010 в 20:14
Сделал. На 21.10 четвертого января сайт по ссылке в сети не обнаружен. На том аудит считаю завершенным.
1. Понятие "фильтр" вряд ли может считаться адекватным сейчас; времена сменились.
2. Проверить просто: посмотрите, какое количество Ваших страниц в индексе, и какие из них участвуют в поиске. Отсюда узнаете, как Гугол расценивает Ваш сайт.
3. Обращаться нужно для начала к своему детищу, сайту: сделайте его таким, чтобы по каждому пункту он соответствовал рекомендациям Гугла для веб-мастеров.
Не, ну что ты понимаешь? Ни прихода, ни тяги... :)
Обычная история: Гугол разобрался в сущности сайта и поставил его туда, где он и должен находиться. То есть, теперь Ваш сайт играет с другими на равных основаниях, по тем же правилам. Выход - сделать его по каждому пункту ЛУЧШЕ других.
Ох, ну что Вы так... Вы открыли новый закон физики - а у Вас его украли?! Да нет же! Вы максимум, что сделали - это переписали своими словами очередную тыщу страниц в Интернете. Полезен ли такой контент? Да так себе...
Я пришел в СЕО после того, как мой сайт по химии психоактивных веществ прикрыли. А там были тысячи схем реакций и "прописей" (так называют химики изложения новых синтезов). Вот это был уникальный, полезный и доселе нигде не встречающийся контент, причем научного содержания и крайне востребованного людьми.
Прямым образом - да. Но вот косвенным - очень помогает! Например, переходы с супер-трастов, где стоит ваша ссылка с "nofollow". И если Гугол это видит - то такой сайт он поставит выше, чем тот, где переходы с камментов в блоге Васи Пупкина.
А говорит он так потому, чтоб не увлекались внешними ссылками. Еще бы - главный гуру Гугла в борьбе со спамом...
С этим полностью согласен!
Кстати, интересную вещь поимел: на одном сайте, который Гугол явно считает авторитетным, я немножечко лоханулся и не заметил, что есть нежелательные показы страниц (типа "версия для печати", "все посты данного автора" и т.п.). Так вот: Гугол.Ру их включил в индекс, но все отправил в "сопли" (и это справедливо, поскольку они даже мне не нужны), а вот Гугол.Ком их не включил в индекс вообще. В результате получилось, что по Гуглу.Ком практически весь сайт находится в основном индексе, что очень и очень хорошо, а по Гуглу.Ру сайт более, чем наполовину, состоит из "плохих" страниц. Это вообще-то терпимо по нынешним временам, но неплохая информация к размышлению, как можно собственной невнимательностью, абсолютно по-глупому ухудшить состояние дел.
P.S. Кстати, кто знает, в каком месте ВордПресса фомируются директория "сайт/author/admin/..." - подскажите, пожалуйста! Надо сделать, чтобы там выдавалась 404-я ошибка.