Логика Гугла - любителям головоломок

12
M0
На сайте с 24.07.2009
Offline
192
#11
Milash:
в title посчитал тоже?

если учесть Титл, дескрипшн и альт к картинке - то конечно больше

AR
На сайте с 01.04.2012
Offline
78
#12

главная доступна по двум/трём адресам, потому и послал её Гугл из-за дублей.. куда подальше ))

п.с. -

http://ortho.in.ua

http://ortho.in.ua/index.php

http://ortho.in.ua/index.php?

http://ortho.in.ua/index.php?act

M0
На сайте с 24.07.2009
Offline
192
#13

And-rey, а как вы это вычислили? в WMT они не числятся как дубликаты

AR
На сайте с 01.04.2012
Offline
78
#14

Mvk09, :) такие комбинации урл главной, и её различные варианты доступности на саму же себя - проблема любой CMS.

Поэтому и появилось со временем в настройках многих CMS пункты "вкл/выкл SEO-урл" или "активировать SEO-модуль" и так далее. Если же нет подобного, то устанавливаются дополнительные модули/плагины.

Ну а если нет возможности использовать вышеотмеченное вообще, то тогда надо идти на сервер и править файлы .htaccess (редирект 301, mod_rewrite.c) и robots.txt (закрывать всё ненужное в Disallow: /)

M0
На сайте с 24.07.2009
Offline
192
#15

And-rey, т.е. даже http://ortho.in.ua/index.php?act - это тоже стандартный вариант?

кстати, я одно время с этим парился, но потом заметил, что site.ru и site.ru/index.php в WMT не появляется как дубликат - разве это не подтверждение того, что Гугл уже поумнел и сам прекрасно понимает, что это не дубликат?

AR
На сайте с 01.04.2012
Offline
78
#16

Mvk09, Обычно на любой CMS, если после слеша "/" в конце урл поставить "index.php" и что-то там откроется по этому адресу.. то дальше можно смело подбирать различные варианты и они сработают. Правда возвратом на главную)

Как пример, вот еще одна "копия" главной - http://ortho.in.ua/index.php?act=

и так далее.

Наберите в гугле запросы тут нижеследующие (обязательно в кавычках как написано), в разных вкладках браузера и посмотрите выдачу по ним, там проиндексированная "главная" в двух видах. Этого достаточно для гугла, дабы ранжировать плохо сайт:

"http://ortho.in.ua"

"http://ortho.in.ua/index.php"

Какая у Вас там CMS стоит, на чём сайт работает/крутится?

M0
На сайте с 24.07.2009
Offline
192
#17

And-rey, проверил. а что это за запрос "урл" (в кавычках) ?

да там цмс какая-то самописная...

так как вы думаете, почему это не попадет в раздел дубликаты в WMT ?

AR
На сайте с 01.04.2012
Offline
78
#18
что это за запрос "урл" (в кавычках) ?

самый быстрый и стандартный мониторинг на наличие в индексе поисковика того, что помещено внтури ковычек. Будь то запрос, будь это урл. Посмотреть: есть ли в индексе?

Mvk09:
почему это не попадет в раздел дубликаты в WMT ?

панель вебмастера давно уже работает на тройку. к примеру стоит попасть туда сообщению о наличии одинаковых мета-описаний.. так после их устранения, сообщение всё одно висит полгода. Или же как в Вашем случаи, вообще не "сообщает", но индексирует сайт с дублями.

То что самописная CMS - вроде нестрашно для сайта с небольшим количеством страниц. Это же не 300 или 500 стр. Поэтому необходимо править на отсечение дублей файлы .htaccess и robots.txt.

Исчерпывающей информации в инете на эту тему прилично...

К примеру решение проблемы с тем же index.php

как стандарт для многих "движков":

# Редирект c www на без www

RewriteCond %{HTTP_HOST} ^www.site.ru

RewriteRule ^(.*)$ http://site.ru/$1 [R=301,L]

# Редирект для главной (с /index.php на /)

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\ HTTP/

RewriteRule ^index\.html$ / [R=301,L]

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\.php\ HTTP/

RewriteRule ^index\.php$ / [R=301,L]

и так далее.. Кароче это уже другая тема и история)

M0
На сайте с 24.07.2009
Offline
192
#19
And-rey:
самый быстрый и стандартный мониторинг на наличие в индексе поисковика того, что помещено внтури ковычек. Будь то запрос, будь это урл. Посмотреть: есть ли в индексе?

а я всегда для этого использовал оператор cache

свои наработки по htaccess то у меня есть, но не со всем сталкивался)) например:

http://ortho.in.ua/index.php?
http://ortho.in.ua/index.php?act
http://ortho.in.ua/index.php?любая-лабуда-дубликат

вот если по этому подскажете, было бы неимоверно круто

AR
На сайте с 01.04.2012
Offline
78
#20

Mvk09, Доброго времени вам! Смотрю никто не ответили, кто заглянули в эту ветку. Ну возможно тоже поддерживают , что надо бы создавать отдельную тему, так проблема уже другая.

Выпилить из урлов index.php? обязательно нужно. Приёмов полно в сети как сделать (первое что попало - http://tradebenefit.ru/kak-ubrat-iz-url-adresa-index-php и здесь же, наскоро как ЧПУ настроить - http://tradebenefit.ru/primery-htaccess-chpu-redirect)

А вот когда index.php стоит в статьях к сайту, и его убрать сейчас... То тогда отпадёт вообще всё что сейчас в индексе. Поэтому редиректом 301 обычно склеивают новые урл сайта со старыми, которые давно в индексе. Просед позиций в этом случаи обязательно произойдёт. Но потом восстанавливается, тут на форуме писалось и не раз.

Остаётся вам разобраться с генерацией ссылок той CMS, что плодит не желаемые урл. И когда настроить всё, то можно приступать вручную прописывать в .htaccess переадресацию на правильные новые урл.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий