Скажем так: в интернет-магазинах карточки товаров в основном определяются как нечеткие дубли с совпадением от 90% текстового контента (если брать всё скопом, без разделения на блоки и секции). И ничего. Хотя за минувший год и под МПК новые сайты залетают недурно.Просто надо иметь в виду такую вероятность, и стараться по максимуму уникализировать страницы в рамках сайта. Меньше мусора, меньше потенциальных МПК - проще будет двигать.
Понял) А на счет моего вопроса выше над этим ответом вашим?
Это всё про спецификацию HTML5. Там уже есть article, nav и прочий aside и другие секционные элементы. Это не про стили. Тут шаблончик сайта надо немножко перепиливать.Что касается css - то там речь именно о псевдостилях, благодаря которым можно выводить текстовый контент, который просто не будет индексироваться в принципе.
Это полностью перепиливать или же например можно тупо взять мой код и нуджные части заключить в теги <main></main><header></header><footer></footer>
Сейчас ради теста тыкнул парочку, вроде на шаблоне никак не отражается визуально ничем..
Зачем? Рендеренный, конечно, грубо говоря - видимую часть. Можно тупо CSS отключить в браузере. Можно в Frog всё это сделать с нужной выборкой.Тут тема не самая простая, и лучше строить гипотезы исходя из реальных данных. Клеит ли запросы на целевую страницу? Если нет- то почему выбрал другую? Нет ли такого, что сегодня одна - завтра другая? Что там в кэше ПС, всё ли попало? Ну, и так далее.Иными словами, если явно есть проблема - можно ломать голову.
Да сайт молодой еще) Я еще не понимаю даже попадет ли в поиск вообще) Просто мысли на будущее чтоб многое предостеречь заранее!
ПС оценивают текстовый контент не за один проход. Сначала - сырой html. Если сочтёт, что там порядок - придёт потом ещё для более углубленных проверок. Сочтёт дублем (хоть и нечетким) - не придёт. И не будет он на старте разбираться, где там меню, где основной контент. Это, в лучшем случае, когда-нибудь.Вот лучше б и не рисковать.
То есть стоит тогда посмотреть вообще исходный код на сравнение?
Похоже на обратный клоакинг)) а где почитать про это ?
А вот Вы говорили про 80% убийство, а если 50%?) Я просто выделил часть текстовую, боковые меню не считал и сервис показал что схожего текста 50%, а 80% это если учитывать меню все и тд
Убирать лишнее. Использовать семантическую вёрстку - чтобы ПС понимали, что вот - зона main content, вот навигация, хедер-футер и т.п. Смотреть через текстовый анализатор. Были у меня примеры, когда вот такие "сквозняки" все страницы сайта делали релевантными одним и тем же ключам и сайт тупо не мог получить позиции, потому что ключи переклеивало всё время с посадки на посадку. А вот после правок шаблона (там, правда, ещё ПФ подключили, но то такое):
А у меня два вопроса к вам. Смотрите, вы написали про майн, футер, хедер, есть общепринятые слова такие? Я не зная этого всегда раньше делал по крайней мере футер и хедер... И второй вопро, такими словечками помечать образно говоря в общий контейнер взять и дописать типа класс мэйн и другие или ждя каждого блока отдельно? И будет ли плохо если прописать класс а сам класс не писать в стилях?
Есть над чем подумать вечерком
Методов несколько, включая картинку.
Но во всех случаях вам надо закрыть от индексации то, чем этот текст выводится, и стойко игнорировать "напоминания" GWT о том, что боту чего-то закрыли.
Да он просто прописан текстом в шаблоне полной новости
Как тогда быть, если текста хочется, но не хочется чтоб он вредил сайту?! Наверное это и есть мой изначальный вопрос темы
Вот у меня и есть вопрос, как поступать, если 80% текста на сайте сквозной? 😞