Вылет сайта из индекса + ответ платона

M
На сайте с 11.01.2006
Offline
153
1316

Здравствуйте.

Выпал в конце августа один мой сайт. Т.к на сайт писались только уникальные статьи, и ссылками не торговал сайт, решил обратиться в суппорт Яндекса.

Отписался им, пришел шаблонный ответ:

После анализа и классификации страниц Вашего сайта наши алгоритмы приняли
решение не включать его в поиск. Это может быть вызвано неуникальностью
информации, использованием поискового спама или тем, что многие страницы сайта
созданы автоматически и не предназначены для чтения пользователями.

Ну я так понял, что можно ставить крест на сайте... однако как-то угараздило меня проверить орфографию на сайте, через яндекс, получил ответ - что страница не может быть загружена..

Начал копаться - проблема оказалась в шаблоне - сменил его, и начал яндекс нормально обрабатывать страницы.. Обрадовался, подождал пару апов, но сайт упорно не лез в индекс.

Решил снова отписаться в яндекс, указав, что я нашел проблему с индексацией. Ответили подождать - разберутся..

Сегодня пришел ответ:

Причина, по которой Ваш сайт был запрещен к индексации, не устранена.
Вопрос возможности восстановления ресурса в поисковой базе Яндекса может быть
рассмотрен не ранее чем через месяц после получения уведомления о принятых
мерах.

Вот это реально становится странным.

О самом сайте:

Движок - Joomla 1.5

Контент - уникальный

Возраст - около 4-5 месяцев

ЧПУ - Artio

Продажа ссылок - отсутствует

Контекстная реклама - отсутствует

Количество страниц, которое было в индексе - около 45

Есть у кого-то идеи по поводу запрета индексации?

Урл могу кинуть в личку, кто захочет глянуть на сайт, может возникнут какие-то идеи :(

T
На сайте с 22.05.2008
Offline
15
#1

Может быть дело в Джумле. Как известно движок генерирует кучу лишних страниц. Я точно не помню, убивает ли Артио дубли. Обратите внимание в панели вебмастера на количество загруженных страниц. Если цифра раз в 100 превышает количество реально существующих, то пытайтесь бороться с дублями. Посмотрите на SEF ссылки, которые сгенерировал Артио - это поможет вам определить масштабы. Если дело в этом (и через Артио нельзя убить дубли), то попробуйте вместо него использовать sh404 - он точно дубли убивает (либо 301 на нужную страницу либо 404). Еще может влиять всякая хрень типа jtags или другие компоненты. Если скинете урл в личку, посмотрю подробнее. Сам с Джумлой мучаюсь - хорошая система, только ссылки генерирует дебильные.

0bevan
На сайте с 23.09.2008
Offline
280
#2
Если цифра раз в 100 превышает количество реально существующих, то пытайтесь бороться с дублями.

ну не в сто, а в 2-3 раза на сколько я знаю, был такой случай с одним полу ГС, полу СДЛ, да чего уж там темнить - stroi-world.ru, после 4-5 месяцев существования сайта с ТИЦем 80-140 и дублирующимися ссылками, яша сайт выкинул из индекса и забанил пол года назад. В причине бана писал за неуник контеент, который на 30% был написан мною вручную, на 60% были картинки с описаниями, а на 10% уникаьный копипаст с новых сайтов.

В чём причина бана я так и не понял :(

Не знаешь как попасть в ТОП? Тебе сюда yandex.ru/admin (http://yandex.ru/admin) ( ͡° ͜ʖ ͡° )
T
На сайте с 22.05.2008
Offline
15
#3

Так-с. Всё нижеперечисленное будет работать, если у вас уникальный контент. Проверять это у меня нет ни времени ни желания.

Рассмотрим по пунктам:

1. Шаблон

Использование стандартного шаблона без уникализации строго не рекомендуется. Тем более шаблона, который входит в стандартную комплектацию. У вас даже шапка стандартная джумлы.Идём хотя бы сюда - http://joomlaportal.ru/content/view/68/79/ и качаем бесплатный шаблон, а лучше покупаем. Потом изменяем его под свои нужды. Желательно все картинки шаблона либо слегка изменить (просто пересохранить графическим редактором, чтобы изменился размер файла) либо заменить своими по вкусу. Шапку сделать свою.

index.php шаблона тоже желательно поменять. Если не хватает знаний - читайте указанный ниже форум. Если совсем плохо - просто добавьте в код счетчик или еще что-нибудь.

2. Измените title на главной. "Главная страница" это не название сайта.

3. Измените мета-теги. Особое внимание уделите description - описанию сайта. Сейчас там стандартные данные джумлы.

4. Вместо ссылки "подробнее" используйте собственный текст (при редактировании статьи справа в панели настроек можно указать альтернативный текст для кнопки "подробнее").

Закройте Яндексу страницы для индексации в robots.txt Но только для Яндекса (по user-agent) до тех пор, пока ваш сайт не станет уникальным по шаблону. Потом открывайте.

Поставьте плагин xmap, который сгенерирует карту сайта (не забудьте расширение xmap для artio чтобы корректно работал плагин). Загрузите ссылку на xml карту в панели вебмастера гугль и яндекс.

Создайте говносайт на народ.ру в котором сделайте несколько страниц по такому шаблону: Кусок статьи (первый абзац) с вашего сайта, потом какой-нибудь левый текст (еще один-два абзаца, можно бредятину) и ссылка прямо в статью на вашем сайте. Естественно ссылка с анкором из ключевых слов статьи.

Сделайте блог на лайвинтернет и там - несколько страниц по примеру гс на народе (но не точные копии, а например другие абзацы из статьи).

Добавьте ссылки из социальных закладок.

Ваша задача - показать роботу, что такие страницы есть на вашем сайте.

При этом старайтесь добавить несколько новых статей на сайт, постепенно, хотя бы раз в неделю.

Поставьте на "морду" модуль вывода последних новостей (статей).

Посетите несколько тематических форумов. Пообщайтесь там. После десятка сообщений аккуратно и в тему киньте пару ссылок на свой ресурс. Или засуньте url себе в подпись, где разрешено.

Всё это нужно сделать в течении месяца. Если после этого сайт не вернётся в индекс, смело пишите Платону "чё за хрень, чувааак?!". Но боги говорят, что после такой молитвы сайты влетают в индекс полностью.

Ресурсы, которые будут вам нужны в работе над сайтом (читать всё подряд):

http://joomlaforum.ru/

http://joom.ru/

http://extensions.joomla.org/

Не обижайтесь, но в данный момент я полностью согласен с вердиктом Яндекса ))). Удачи вам в нашем нелёгком деле.

Rudokop
На сайте с 29.07.2008
Offline
159
#4

Я в друпале тоже закрыл от индексации ненужные страницы, чтобы всякая ерунда в индекс не лезла. Этот вопрос уже обсуждался (кстати, недавно) на серче.

[Удален]
#5

Действительно часто такая проблема с Джомлой, когда она генерирует много страниц-дублей, лишних страниц. Проверяйте именно этот фактор.

P
На сайте с 13.07.2007
Offline
48
#6

ярунда, про страницы дубли - поисковые системы сами прекрасно справляются с этой задачей (не показа одной и той же страницы по нескольким урлам) и это не является нарушением лицензии

M
На сайте с 11.01.2006
Offline
153
#7
alegra:
Действительно часто такая проблема с Джомлой, когда она генерирует много страниц-дублей, лишних страниц. Проверяйте именно этот фактор.

Только что проверил...

Краулер нашел 51 страницу, которые реально со статьями..

У яндекса в панельке показывается 128 загруженных страниц.

47 ошибок:

HTTP-статус: Ресурс не найден (404) - 1 ошибка

HTTP-статус: Ресурс перемещён навсегда (301) 1 ошибка

Формат документа не поддерживается - 12 ошибок

Документ содержит мета-тег noindex - 33 ошибки.

Что могу сказать по этим ошибкам:

Формат документа не поддерживается - в этих ошибках указывается сссылки на RSS ленты.

Документ содержит мета-тег noindex - в этих ошибках указываеются ссылки на страницы с печатью статьи..

T
На сайте с 22.05.2008
Offline
15
#8

Magistr, я же вам ответил, что нужно делать постом выше. У вас нет проблемы с дублями, Артио нормально их убивает. Тут дело не в этом. У вас проблема в том, что ваш сайт в нынешнем виде по факту совершенно не отличается от только что установленного пустого движка с демо-данными. Те же теги (везде Joomla, joomla), тайтл морды "Главная страница", стандартный шаблон, название сайта "Joomla"... Вам по большому счёту не сюда надо обращаться, а в тематические форумы Джумлы. Вы не приложили усилия к тому, чтобы сделать ваш ресурс уникальным с точки зрения робота. И здесь Яндекс совершенно прав, сайтов с точно таким же кодом как у вас сотни тысяч как минимум.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий