индексация php

12
G2
На сайте с 30.11.2004
Offline
84
828

Ситуция такая:

есть сайт на php, соответственно главная страница доступна так domen.ru/index.php и так domen.ru

анализируя выдачу нахожу непонятные странички в поисковиках, типа domen.ru?id=blabla, такого на сайте нету и соответственно выдаётся главная страница.

index.php не скрипт, там почти один хтмл код.

теперь вопрос: как сделать чтобы робот получал 404 при таком раскладе? :)

есть мысль в robots.txt написать

"Disallow: index.php?"

но есть сомнения...

M
На сайте с 18.10.2003
Offline
65
#1

Чтобы робот получал 405 можно попробувать добавить в PHP:


<?
if ($id) {
header("HTTP/1.0 404 Not Found");
}
?>
G2
На сайте с 30.11.2004
Offline
84
#2

при таком варианте, 404 будет строго у урлов которые начинаются с index.php?id=

а мне надо чтобы 404 выдавалась если начинается с index.php?

ибо ерезь в выдаче находится разная

index.php?blabla=blala

ещё интересно откуда хоть такое чудо берется, это рамблер такое отлавливает и получается куча дублей :-\

Armee
На сайте с 22.11.2004
Offline
148
#3
это рамблер такое отлавливает и получается куча дублей

не совсем понял ты же только что писал

нахожу непонятные странички в поисковиках, типа domen.ru?id=blabla, такого на сайте нету

значит не из бездны взялись эти урлы?

СНИП 2017! (http://snyp.binpartner.com/) Крупнейшая вебмастерская новогодняя тусовка в РФ! BetAdvert (http://betadvert.com/r/51/) - спортивного трафика мощный конверт
CD
На сайте с 21.10.2004
Offline
82
#4
Как писал glad2k
при таком варианте, 404 будет строго у урлов которые начинаются с index.php?id=
а мне надо чтобы 404 выдавалась если начинается с index.php?
ибо ерезь в выдаче находится разная
index.php?blabla=blala

ещё интересно откуда хоть такое чудо берется, это рамблер такое отлавливает и получается куча дублей :-\

в самое начало файла:

<?php

$RURL=$_SERVER['REQUEST_URI'];
if (stristr($RURL, '?')) {header("HTTP/1.0 404 Not Found");}
?>
Отличная конвертация женского трафика. (http://tinyurl.com/394ayz3) Второй месяц - в подарок! Core2Duo E6600 2x2.4ГГц / 4ГБ / 2x250ГБ => $68/мес. (http://tinyurl.com/E6600)
G2
На сайте с 30.11.2004
Offline
84
#5
Как писал CompDocs

в самое начало файла:
<?php

$RURL=$_SERVER['REQUEST_URI'];
if (stristr($RURL, '?')) {header("HTTP/1.0 404 Not Found");}
?>

Не помогло, даже никак изменений :(

G2
На сайте с 30.11.2004
Offline
84
#6
Как писал Armee
значит не из бездны взялись эти урлы?

да я сам не могу понять откуда они взялись, ловит их только рамблер

и ловит такие параметры у главной страницы

например:

domen.ru/?fileid=123

domen.ru/?S=lala

и прочий бред

хотя index.php сводится к обыному коду хтмл + два инклуда (хедер, футер)

ну вот дабы не ломать голову, хочу запретить сие чудо к индексу

CD
На сайте с 21.10.2004
Offline
82
#7
Как писал glad2k

Не помогло, даже никак изменений :(

пиши в саппорт хостинга

видно как-то перекрыт $_SERVER["REQUEST_URI"]

он возвращает полный запрошенный урл относительно сервера

или как вариант, попробуй вот так:


<?php
$RURL=$REQUEST_URI;
if (stristr($RURL, '?')) {header("HTTP/1.0 404 Not Found");}
?>

stristr по идее стандартная функция

но если и так не запахает, попробуй вторую строчку заменить на

echo $RURL;

и погляди что он выдаст на той страничке в браузере

CD
На сайте с 21.10.2004
Offline
82
#8

упс :)

просто писал прям тут, не проверял, до меня дошло...

{header("HTTP/1.0 404 Not Found");}

заменяй на

{header("HTTP/1.0 404 Not Found"); exit;}

и все будет пучком ;)

G2
На сайте с 30.11.2004
Offline
84
#9

CompDocs, во теперь заработало, спасибо.

Ну а чтобы совсем было пучком, это выглядит вот так:

{header("HTTP/1.0 404 Not Found"); include('http://domen.ru/404.html'); exit;}

:)

V2
На сайте с 28.10.2004
Offline
40
#10

Не совсем понимаю, если даже таких страниц нет, но они обеспечивают автору дополнительных посетителей, то заче он хочет их отрубить ? Зачем выдавать 404 ошибку, вместо главной страницы ?

Бесплатный счетчик посещений. Статистика посещаемости сайта. (http://www.web-keeper.net/) Широкие услуги вебмастера. (http://rus-job.info/)
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий