SEO - уязвимости.

12 3
L
На сайте с 21.03.2010
Offline
2
2106

всем добрый вечер. у меня следующий вопрос. как защитить от злых дядек и тетек дубликаты URL, например адреса: "site.ru/" и "site.ru/index.php"? слышал про серверные заголовки (типо 404), но не знаю как ими пользоваться. или может как то можно запретить индексировать один из них в robots.txt? подскажите правильное решение.

WebAlt
На сайте с 02.12.2007
Offline
259
#1

Ошибка 404 обозначает, что запрошенному вами URL не соответствует никакая страница сайта. Этому могут быть две причины: ссылка неверна или ранее существовавшая страница была удалена.

Jekyll
На сайте с 04.05.2009
Offline
136
#2

Конкретно для этого случая можно в robots.txt замутить Disallow: /index.php

L
На сайте с 21.03.2010
Offline
2
#3
WebAlt:
Ошибка 404 обозначает, что запрошенному вами URL не соответствует никакая страница сайта. Этому могут быть две причины: ссылка неверна или ранее существовавшая страница была удалена.

404 ошибка я и так знаю что означает. вопрос другой, как с помощью данного заголовка, запретить выдовать содержимое по адресу site.ru/index.php, а по адресу site.ru/ выдовать все нормально.

M
На сайте с 04.03.2009
Offline
21
#4

в robots.txt пропишите параметр host

как мало пройдено дорог, как много сделано дорвеев... а у меня с Яндексом Платоническая любовь! mall (c)
L
На сайте с 21.03.2010
Offline
2
#5
Jekyll:
Конкретно для этого случая можно в robots.txt замутить Disallow: /index.php

т.е. он site.ru/index.php индексировать не будет, а site.ru/ будет, так? т.е. site.ru/ главное зеркало, адрес index.php проиндексирует?

[Удален]
#6

robots.txt - все помогает. Почитайте про него и вопросы отпадут.

Jekyll
На сайте с 04.05.2009
Offline
136
#7

Нет, он на index.php вообще заходить не будет, не проиндексирует. Если уже проиндексировал - скоро выкинет из индекса

L
На сайте с 21.03.2010
Offline
2
#8
mall:
в robots.txt пропишите параметр host

эта директива отвечает ведь за определение главного зеркала, так? т.е. нужно прописать host: ".site.ru/". и тогда это будет главное зеркало? просто проблема в том, что если злобный супостат решит в форме addurl добавить ".site.ru/index.ru" произойдет склейка, а соответственно ссылка на этот адрес потеряет вес.

Lisandr добавил 24.03.2010 в 23:28

Jekyll:
Нет, он на index.php вообще заходить не будет, не проиндексирует. Если уже проиндексировал - скоро выкинет из индекса

тогда какие еще могут быть варианты?

Vanich
На сайте с 10.07.2007
Offline
165
#9

Можно 301 редирект с помощью mod_rewrite поставить, только тут важно оставить то, что уже фигурирует в индексе поисковиков (основное зеркало), а то будет вылет из индекса на месяцок-другой.

Онлайн-консультант для юридических, медицинских, компьютерных, туристических сайтов. Удобно пользователю, прибыльно вебмастеру. (http://webmasters.leadia.ru/?ref=bIoqZIaath) MONKEYWRITE ТЕПЕРЬ БЕСПЛАТНО (https://yadi.sk/d/Hd9mbvyzeMMfp)
yanus
На сайте с 21.01.2009
Offline
348
#10
Jekyll:
Конкретно для этого случая можно в robots.txt замутить Disallow: /index.php

люди, вот вы жжоте. вы хоть бы спросили а другие страницы на сайты с каким раширением))))

Disallow: /index.php - запретит индексацию всех страниц сайта с расширением .php

чтобы избавится от дубля главной страницы и не поиметь лишних проблем нужно сделать 301-рдирект.

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий