Анонсы статей? АГС?

goliafz
На сайте с 16.07.2008
Offline
94
1199

Приветствую.

Платформа дле.

Анонс берется через php путем обрезания до определенного количества символов. Т.е. анонс - не уникальный.

Какое количество символов может быть в анонсе статьи, чтобы сайт не попал под АГС за нечеткие дубли?

Stolz
На сайте с 25.01.2007
Offline
181
#1

На моем сайте обрезается 160 и 200 символов. Статей и новостей более 70 тысяч. Все ОК.

Если только в этом проблема, то АГС вряд ли наступит. Следует искать другие грехи ))

YarpivceV
На сайте с 06.10.2011
Offline
8
#2

У меня аналогичный вопрос. Правда движок joomla. Какое количество символов может быть в анонсе? Вернее в новостях выводимых пунктом меню в виде блога категории. Т.е. статьи разделяю кнопкой "подробнее". Просто не задолго до АГС, у меня анонсы доходили до 50% от всей статьи и даже больше. Сейчас, конечно я их укоротил, после АГС 🙄. Но вопрос остался?

Rusreach
На сайте с 22.01.2008
Offline
61
#3

Если анонсы в категориях - то самое простое -они закрываются от индексации, бот яндекса ходит по ссылкам, но в индекс не забирает..

Если эта категория двигается по ключам/запросам, то конечно, лучше в начале категории использовать статический текст (например, описание категории), а анонсы закрывать.

Самый лучший способ - дать ТЗ программисту допилить так, чтобы ботам отдавались лишь заголовки, сам текст анонса чтобы не отдавался ни Гуглу , ни Яндексу (текста анонса просто будет не видно в html коде страницы). Делается это при помощи jquery + css.

YarpivceV
На сайте с 06.10.2011
Offline
8
#4
Rusreach:
Если анонсы в категориях - то самое простое -они закрываются от индексации, бот яндекса ходит по ссылкам, но в индекс не забирает..

Не могли бы Вы указать, что именно нужно прописать в robots, чтобы закрыть категории. Мне все равно пока не светит их продвинуть. Заранее благодарен.

A
На сайте с 13.05.2010
Offline
55
#5
YarpivceV:
Не могли бы Вы указать, что именно нужно прописать в robots, чтобы закрыть категории. Мне все равно пока не светит их продвинуть. Заранее благодарен.

Если у вас структура ссылок имеет обычную форму, т.е. my-site.ru/razdel/material.html

То вам помогут следующие правила в robots.txt

Allow: /razdel/*.html

Disallow: /razdel

Первое правило разрешает индексировать страницы с новостями, а второе правило запрещает индексировать страницы рубрик на которых у вас и содержится вступительный текст, т.е. какая-то часть новостей.

Правила необходимо ставить именно в таком порядке!

Поставив правила в обратном порядке, вы запретите индексацию всех материалов раздела вместе с самим разделом.

И ещё:

  • Пару постов выше говорилось о том, как убрать из индекса вступительный текст с помощью скриптов.
  • Некоторые делают страницы рубрик как страницы входа из-за их релевантности определённому запросу.
  • Shakin как-то постил у себя на блоге перевод официального ответа представителя Google на подобный вопрос. Суть такова - Гугл понимает что такое блог, т.е. раздел и что такое новость. Можно вообще не загонять посты под кат. Некоторые, кстати так и делают.
  • Немного чернухи - Не натыкались на сайты с постами из комбинации вступлений? Хитрые караси отбирают сайты где рубрики закрыты, копипастят инфу со страницы, минимальная чистка (удаляются даты, автор и т.д.) и всё - У вас уникальный релевантный текст!
S
На сайте с 17.04.2011
Offline
250
#6
artool:

  • Некоторые делают страницы рубрик как страницы входа из-за их релевантности определённому запросу.
  • Вот у меня аналогичная картина. И эти разделы, напичканные анонсами, лезут в ТОП. Думаю все-таки из-за этого ни один поисковик не накажет. На огромном количестве сайтов анонсы являются началом самой статьи...

    YarpivceV
    На сайте с 06.10.2011
    Offline
    8
    #7
    artool:
    Если у вас структура ссылок имеет обычную форму, т.е. my-site.ru/razdel/material.html
    То вам помогут следующие правила в robots.txt

    Allow: /razdel/*.html
    Disallow: /razdel

    Вообще ссылка блога категории у меня имеет вид: my-site.ru/название категории/blog, а вот ссылка материала: my-site.ru/название категории/название материала. Как быть в таком случае?

    Может Disallow: /blog.

    Ведь категорий на сайте, не одна и не две. Искал в нете, но что-то информации конкретно об этом не встретил. Наверное плохо искал.

    A
    На сайте с 13.05.2010
    Offline
    55
    #8
    YarpivceV:
    Вообще ссылка блога категории у меня имеет вид: my-site.ru/название категории/blog, а вот ссылка материала: my-site.ru/название категории/название материала. Как быть в таком случае?
    Может Disallow: /blog.
    Ведь категорий на сайте, не одна и не две. Искал в нете, но что-то информации конкретно об этом не встретил. Наверное плохо искал.

    Правило Disallow: /blog вам не подходит, поскольку между my-site.ru и blog присутствует название категории.

    При таком строении линка, как вы указали, т.е my-site.ru/название категории/blog, вам можно смело писать следующее правило:

    Disallow: */blog

    Данное правило исключит из индексации любые страницы, которые имеют следующий адрес:

    my-site.ru/*/blog

    Звёздочка перед слешем - любые буквы, цифры и т.д.

    Нужно отметить - если мы после слова blog не ставим слеш (Это зависит от ваших настроек ЧПУ), то данное правило исключит из индекса и такие адреса как: my-site.ru/*/blog-o-nas Т.е. будут ислючены новости, которые начинаются со слова блог.

    Вообще, для проверки настройки файла robots.txt есть вот такой чудесный сервис от Яндекса - http://webmaster.yandex.ru/robots.xml У гугли, тоже есть в панели вебмастера сервис для проверки настройки индексации.

    Вот в этом комментарии я подробно изложил, как пользоваться данным сервисом и закрыть от индексации ненужную страницу - /ru/forum/comment/9725069

    В вашем случае всё по аналогии с приведённым примером.

    Будут ещё какие-то вопросы - обращайтесь, буду рад помочь.

    N
    На сайте с 26.10.2009
    Offline
    152
    #9

    Для сателлитов. Берите в качестве анонсов 3-4 предложения из всей статьи. Добавляйте 2-3 ключа. Выходит около 250 символов. Все сайты в индексе.

    YarpivceV
    На сайте с 06.10.2011
    Offline
    8
    #10
    artool:
    Правило Disallow: /blog вам не подходит, поскольку между my-site.ru и blog присутствует название категории.

    При таком строении линка, как вы указали, т.е my-site.ru/название категории/blog, вам можно смело писать следующее правило:
    Disallow: */blog
    Данное правило исключит из индексации любые страницы, которые имеют следующий адрес:
    my-site.ru/*/blog
    Звёздочка перед слешем - любые буквы, цифры и т.д.

    Нужно отметить - если мы после слова blog не ставим слеш (Это зависит от ваших настроек ЧПУ), то данное правило исключит из индекса и такие адреса как: my-site.ru/*/blog-o-nas Т.е. будут ислючены новости, которые начинаются со слова блог.

    Вообще, для проверки настройки файла robots.txt есть вот такой чудесный сервис от Яндекса - http://webmaster.yandex.ru/robots.xml У гугли, тоже есть в панели вебмастера сервис для проверки настройки индексации.

    Вот в этом комментарии я подробно изложил, как пользоваться данным сервисом и закрыть от индексации ненужную страницу - /ru/forum/comment/9725069
    В вашем случае всё по аналогии с приведённым примером.
    Будут ещё какие-то вопросы - обращайтесь, буду рад помочь.

    Большое спасибо за столь развернутое и подробное пояснение.;) Обязательно пропишу в robots.

    Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий