Как мне поступить с сайтом. Проблемы с дублями Joomla 3

1
На сайте с 10.10.2010
Offline
73
962

Как мне поступить, не могу справиться с дублями на одном сайте. На более мелких сайтах использую sef 404 или просто обхожусь одним robots.txt.

Но сейчас занимаюсь большим сайтом и sef не подходит по нескольким причинам, во первых перегружать сайт не хочу, во вторых это в компоненте изначально часто не правильно прописываются пути, особенно у материалов не привязанных к меню, и приходится в ручную выбирать среди дублей нужный материал.

На небольших сайтах это не проблема, но здесь сотни и страниц с тысячами дублей будет, и в ручную это перебирать просто не вариант. Ну и другие проблемы есть.

Роботс тоже не подходит. К примеру по запросу site:сайт/strany/aziya/turtsiya выдаёт

Пути к медицине на Кубе, фотографии Испании и тд. (И что получается, на каждый материал мне нужно делать от в среднем 30 запретов:eek:)

Вот как примерно бороться с подобной проблемой.

Запрос site:сайт.ru/spravochnaya-ispanii

Выдаёт:

Справочная Испании - название сайта

сайт/spravochnaya-ispanii/ispaniya

То есть рабочая страница и

Справочная Испании - название сайта

сайт/spravochnaya-ispanii/ispaniya/viza-v-ispaniyu

Уже даже матерится нет слов, проклинаю тот день когда связался с джумлой. Серьёзно, я лучше бы на статическом сайте всё это сделал, знал бы о проблемам на перед.

И что можете посоветовать, сменить движок и всё переписать? А на какой тогда( с wordpress связываться не хочу, после того, как мой единственный сайт на нем в бан попал не из-за чего, на joomla таких не было) или реально потратить время переделать всё в html. Или может все же есть какое-то стоящее решение?

Пс. Есть на одном сайте на joomla статьи под ключ и скрипт вопросов с теми же ключами в вопросе.

Ключ вопроса(скрипта) находится в топе при общем количестве знаков в 200-300, а этот же ключ где написана большая и уникальная статья, в 2500 знаков, в ж.. Это наводит на мысль, что сайт сделанный на joomle изначально находится ниже в поисковой выдаче чем если сайт сделать на другом движке или (в моём случае скрипте). Так ли это?

1
На сайте с 10.10.2010
Offline
73
#1
Don_Carlos:
Давно пользуюсь sh404SEF и с материалами не замечал таких проблем никогда. Есть траблы, но это больше относиться к сторонним модулям и плагинам. Но и они решаются при желании.

Насчет тормозов из-за sh404SEF (при включенном у него кэше) вопрос спорный.

Как вариант, отключить sh404SEF и воспользоваться встроенным ЧПУ.

Поисковикам по барабану, на чем именно сделан сайт.

Сейчас и пользуюсь стандартным ЧПУ, sh 404 снёс, на небольших сайтах тоже проблем с ним нет. Но когда страницы доходят до4-5ув, то пути к странице могут быть разные, самое частое это когда материал выводился на главной со всеми модулями, которые только на главной, приходилось в ручную выбирать правильный путь среди дублей.

На счёт по барабану все же сомневаюсь, хотя бы из-за примера выше. Но с другой стороны критерии такого поведения ПС не известно ни кому кроме самих разработчиков.

pragmatik
На сайте с 19.03.2013
Offline
133
#2

Во-первых, линейка 3.X на данный момент еще находится в положении "тестовой", у меня после очередного обновления админка умирала из-за конфликта с xmap. Т.е. это не та ветка на которой следовало начинать серьезный проект. Я бы смотрел в сторону 2.5 да и то, если совсем нет денег на простенькую лицензию от битрикса, ибо, если у Вас проблемы с ЧПУ Joomla, то все дыры в уязвимости Вы, скорее всего, также не закроете, а это чревато взломами и тратой денег/нервных клеток. Если все же решите бороться с дублями на текущем движке, то смотрите в сторону структуры - для того, чтобы не было дублей она должна на 100% соответствовать структуре меню.

Т.е. если у вас есть пункт меню категория1/категория2/статья1 то в менеджере материалов статья1 обязательно должна лежать в категории2, которая, в свою очередь должна иметь в качестве родителя категорию1

Вообще, я бы рекомендовал посмотреть в сторону blogspot - это сервис блогов от google. Плюсы: возможность привязать свой домен, отсутствие затрат на хостинг, встроенная система комментариев, высокая надежность и гибкий дизайн (можно нарисовать что душе угодно, вот пример - http://blog.tbhcreative.com). Из минусов url вида http://blog.tbhcreative.com/2014/05/the-pros-and-cons-of-hero-graphics.html т.е. в нем всегда будут год и месяц размещения материала.

1
На сайте с 10.10.2010
Offline
73
#3

Ну во первых обновления ни кто не отменял. У меня уже 3 сайта на joomla 3 и ни каких проблем нет(тьфу тьфу тьфу), кроме этого с дублями, которые были на 2.5 и раньше. На более простых сайтах эта проблема для меня не особо роли играет, материалов не много и бороться с дублями легко.

На счёт структуры.

Структура у меня абсолютно правильная, не первый сайт.

Во вторых не сама структура влияет на дубли, а сколько внутренних ссылок идёт на сам материал. На материал, на который ссылается главное меню, ссылка с другого материала, ссылка с карты, тэги и тд. создают дубли. И если тэги и тп можно легко запретить в роботсе, то с выше написанным примером(в начале поста), я кроме sh 404 не знаю, но опять по выше написанной причине его устанавливать не буду.

Бесплатные сервера меня не интересуют (снимаю свой), тем более ни вижу связи с дублями и сервером(хостнгом).

pragmatik
На сайте с 19.03.2013
Offline
133
#4
12Gerc:
На материал, на который ссылается главное меню, ссылка с другого материала, ссылка с карты, тэги и тд. создают дубли.

Странно, у меня и карта сайта и метки показывают одинаковые ссылки на материалы и дублей не возникает. Про ссылки с других материалов вообще не понял, их же не система формирует, а Вы вручную вставляете, соответственно и претензии в этом случае к Вам, а не к системе.

1
На сайте с 10.10.2010
Offline
73
#5
pragmatik:
Про ссылки с других материалов вообще не понял.

Я просто уже писал перед сном. Уже не помню, что имел в виду.

pragmatik:
метки показывают одинаковые ссылки на материалы и дублей не возникает

Ну значит вы что-то путаете. Тэги всегда закрываются в роботсе, та как они создают дубли.

В любом случае, решил основной сайт так и оставить, все равно ВЧ не продвину без вложений, а подкатегории вынести на поддомены, и наверно статическими сделаю.

Пс. счас более тщательно посмотрел и вроде дубли только у самых основных материалов, а значит можно потратить время на запрет в роботсе

pragmatik
На сайте с 19.03.2013
Offline
133
#6
12Gerc:
Я просто уже писал перед сном. Уже не помню, что имел в виду.

Позвольте поинтересоваться в нормальном ли состоянии Вы печатали строки:

12Gerc:
Ну значит вы что-то путаете. Тэги всегда закрываются в роботсе, та как они создают дубли
Если всё настроено КОРРЕКТНО теги должны отдавать список материалов, которым они присвоены, с КОРРЕКТНЫМИ адресами этих материалов. И то, что у Вас или у кого-то еще никогда не получалось КОРРЕКТНО задать настройки, к сожалению, не может свидетельствовать в пользу того, что я что-то путаю. Повторюсь: разумно не искать костыльные решения, а устранить саму причину возникновения дублей, т.е. настроить систему таким образом, чтобы исключить их появление. А затем уже потихоньку убивать дубли, которые успели просочиться в выдачу ПС.
1
На сайте с 10.10.2010
Offline
73
#7
pragmatik:
Позвольте поинтересоваться в нормальном ли состоянии Вы печатали строки:Если всё настроено КОРРЕКТНО теги должны отдавать список материалов, которым они присвоены, с КОРРЕКТНЫМИ адресами этих материалов. И то, что у Вас или у кого-то еще никогда не получалось КОРРЕКТНО задать настройки, к сожалению, не может свидетельствовать в пользу того, что я что-то путаю. Повторюсь: разумно не искать костыльные решения, а устранить саму причину возникновения дублей, т.е. настроить систему таким образом, чтобы исключить их появление. А затем уже потихоньку убивать дубли, которые успели просочиться в выдачу ПС.

Не беспокойтесь, в нормальном.

Что бы уменьшить дубли можно не создавать теги. Повторю, не спроста закрывают теги в роботсе.

Когда в поисковике на страницу имеется переход с главного ключа и с тега на одну и ту же страницу ("теги должны отдавать список материалов, которым они присвоены") , это уже говорит о том, что это дубль. Или вы что-то другое считаете дублем?

В любом случае не вижу смысла продолжать этот диалог, тем более, что для себя нашел решение.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий