index.php Дубль страницы?

falkas
На сайте с 21.01.2013
Offline
53
3321

Добрый день. У меня сайт на джумле. Подскажите, считается ли mysite.ru/index.php дублем главной страницы? Стоит ли его закрывать от индексации? И еще, я в .htaccess убрал index.php в названии страниц, то есть было mysite.ru/index.php/slovo.htm теперь mysite.ru/slovo.htm, но по старому адресу mysite.ru/index.php/slovo.htm все равно можно зайти на страницу slovo.htm, поэтому, чтобы избежать дублей страниц я в файл robost.txt добавил следующие строки

Disallow: /index.php/

Disallow: /index.php*

Правильно ли я сделал. И я еще совсем новичек, вчера только начал "колдовать", страницы запрещенные в robots.txt сами исчезнуть из индекса?

MyGoodJob.ru (https://mygoodjob.ru/) — проект о работе, мошенничестве и многом другом.
Оу!
На сайте с 19.12.2007
Offline
221
#1

от индексации index.php закрывать не надо, просто сделайте редирект - редирект index.php

mysite.ru/index.php/slovo.htm на mysite.ru/slovo.htm тоже надо менять редиректом, а лучше изначально не создавать такие ссылки.

Лучшие мобильные прокси тут: https://goo.su/pU6uat
falkas
На сайте с 21.01.2013
Offline
53
#2
Оу!:
от индексации index.php закрывать не надо, просто сделайте редирект - редирект index.php

mysite.ru/index.php/slovo.htm на mysite.ru/slovo.htm тоже надо менять редиректом, а лучше изначально не создавать такие ссылки.

В итоге я так и сделал. Вы извините за мою неграмотность, ниже выложу свой .htaccess

Я в первых 2 частях сделал редирект с index.php и home на главную страницу, но проблема с mysite.ru/index.php/slovo.htm и mysite.ru/slovo.htm осталась . Для каждой страницы нереально прописывать редирект. CMS Jopmla. В итоге я решил оставить в robots.txt строку Disallow: /index.php/ . Есть ли другой выход.

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\.php\ HTTP/

RewriteRule ^index\.php$ http://v-internete-rabota.ru/ [R=301,L]

#######skleyka index.php

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /home\ HTTP/

RewriteRule ^index\.php$ http://v-internete-rabota.ru/ [R=301,L]

#######skleyka home

##

# @version $Id: htaccess.txt 10492 2008-07-02 06:38:28Z ircmaxell $

# @package Joomla

# @copyright Copyright (C) 2005 - 2008 Open Source Matters. All rights reserved.

# @license http://www.gnu.org/copyleft/gpl.html GNU/GPL

# Joomla! is Free Software

##

#####################################################

# READ THIS COMPLETELY IF YOU CHOOSE TO USE THIS FILE

#

# The line just below this section: 'Options +FollowSymLinks' may cause problems

# with some server configurations. It is required for use of mod_rewrite, but may already

# be set by your server administrator in a way that dissallows changing it in

# your .htaccess file. If using it causes your server to error out, comment it out (add # to

# beginning of line), reload your site in your browser and test your SEF url's. If they work,

# it has been set by your server administrator and you do not need it set here.

#

#####################################################

## Can be commented out if causes errors, see notes above.

Options +FollowSymLinks

#

# mod_rewrite in use

RewriteEngine On

########## Begin - Rewrite rules to block out some common exploits

## If you experience problems on your site block out the operations listed below

## This attempts to block the most common type of exploit `attempts` to Joomla!

#

# Block out any script trying to set a mosConfig value through the URL

RewriteCond %{QUERY_STRING} mosConfig_[a-zA-Z_]{1,21}(=|\%3D) [OR]

# Block out any script trying to base64_encode crap to send via URL

RewriteCond %{QUERY_STRING} base64_encode.*\(.*\) [OR]

# Block out any script that includes a <script> tag in URL

RewriteCond %{QUERY_STRING} (\<|%3C).*script.*(\>|%3E) [NC,OR]

# Block out any script trying to set a PHP GLOBALS variable via URL

RewriteCond %{QUERY_STRING} GLOBALS(=|\[|\%[0-9A-Z]{0,2}) [OR]

# Block out any script trying to modify a _REQUEST variable via URL

RewriteCond %{QUERY_STRING} _REQUEST(=|\[|\%[0-9A-Z]{0,2})

# Send all blocked request to homepage with 403 Forbidden error!

RewriteRule ^(.*)$ index.php [F,L]

#

########## End - Rewrite rules to block out some common exploits

# Uncomment following line if your webserver's URL

# is not directly related to physical file paths.

# Update Your Joomla! Directory (just / for root)

# RewriteBase /

########## Begin - Joomla! core SEF Section

############# Use this section if using ONLY Joomla! core SEF

## ALL (RewriteCond) lines in this section are only required if you actually

## have directories named 'content' or 'component' on your server

## If you do not have directories with these names, comment them out.

#

#RewriteCond %{REQUEST_FILENAME} !-f

#RewriteCond %{REQUEST_FILENAME} !-d

#RewriteCond %{REQUEST_URI} ^(/component/option,com) [NC,OR] ##optional - see notes##

#RewriteCond %{REQUEST_URI} (/|\.htm|\.php|\.html|/[^.]*)$ [NC]

#RewriteRule ^(content/|component/) index.php

#

########## End - Joomla! core SEF Section

########## Begin - 3rd Party SEF Section

############# Use this section if you are using a 3rd party (Non Joomla! core) SEF extension - e.g. OpenSEF, 404_SEF, 404SEFx, SEF Advance, etc

#

RewriteCond %{REQUEST_URI} ^(/component/option,com) [NC,OR] ##optional - see notes##

RewriteCond %{REQUEST_URI} (/|\.htm|\.php|\.html|/[^.]*)$ [NC]

RewriteCond %{REQUEST_FILENAME} !-f

RewriteCond %{REQUEST_FILENAME} !-d

RewriteRule (.*) index.php

#

########## End - 3rd Party SEF Section

Оу!
На сайте с 19.12.2007
Offline
221
#3

А вот эту задачу я уже сам, к сожалению, не решу) Плохо разбираюсь в регулярных выражениях для .htaccess.

Кто поможет пациенту?)

P
На сайте с 12.06.2013
Offline
0
#4

Подскажите, как правильно запретить индексацию в robots? На сайте очень много дублей страниц. На один товар может быть по 2-3 дубликата.

christianbooks.odessa.ua/books/11261/

christianbooks.odessa.ua/books/11261/Poobeshai+mne

Нужно чтоб индексировалась только первая страница, а уже адрес страницы с названием книги нет!?

M0
На сайте с 24.07.2009
Offline
192
#5
Оу!:
от индексации index.php закрывать не надо

а я закрыл, это что, совсем нехорошо? 😕

Disallow: /index.php

ведь это не мешает самой главной странице http://site.ru/ быть в кэше

Оу!
На сайте с 19.12.2007
Offline
221
#6
Mvk09:
Disallow: /index.php
ведь это не мешает самой главной странице http://site.ru/ быть в кэше

Главной странице не мешает, но всё-равно так не делается - может быть несколько причин, по которым Вы хотите избавиться от index.php, и все они решаются одним правильным редиректом.

M0
На сайте с 24.07.2009
Offline
192
#7

я хотел сделать редирект, но не особо силен в htaccess - после прописывания редиректа в нем у меня перестают работать другие функции, например чпу

поэтому и стало интересно - а почему именно вы говорите "так не делается", что в этом плохого?

SM
На сайте с 12.06.2013
Offline
0
#8

На Joomla такое с помощью Artio JoomSEF решается

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий