Как Яндекс индексирует PHP? Помогите разрешить загадку

12
E
На сайте с 05.10.2005
Offline
172
1286

Помогите, пожалуйста, разрешить мучающую меня загадку.

Полтора года назад я перенес свой сайт с бесплатного хостинга на платный и перевел его с HTML+Java на PHP. Старую версию удалять не стал, просто поставил там ссылки на новую. Правда, до последнего времени ссылки были явовские, то есть для роботов недоступные.

Новая версия на http://anton2ov.spb.ru существует с 30.04.2004. Специально ее раскруткой я не занимался, но сейчас Яндекс находит ссылки на нее примерно с сотни страниц и тИЦ=10.

И при всем при этом Яндекс за полтора года проиндексировал на сайте только одну страницу - index.php.

Другие поисковики пошли чуть дальше. Они находят страницы, на которые есть ссылки с index.php.

Страницы третьего уровня вложенности не находит ни один поисковик, кроме А9, которым мало кто пользуется.

Вот я и гадаю, с чем это связано.

Ссылки на сайте прямые. Единственный нюанс - страницы открываются через 404-ю ошибку. То есть вместо http://anton2ov.spb.ru/poe/main.php?id=81 ссылка выглядит как http://anton2ov.spb.ru/poe/81.php

Структура сайта, правда, не очень хорошо продуманная. Я тогда только начинал осваивать PHP и малость перемудрил. А теперь пришлось бы слишком много менять. Но по моим представлениям это все на индексацию в поисковиках влиять не должно.

А что влияет - непонятно. В порядке эксперимента я сварганил за полчаса сайтик из нескольких страничек на чистом HTML, неделю назад выложил его на бесплатном хостинге и добавил УРЛ в Яндекс. Сегодня смотрю - весь сайтик уже проиндексирован полностью.

И вот я задался целью выяснить - что не так с anton2ov.spb.ru, если Яндекс полтора года не может проиндексировать больше одной страницы, в то время как другие сайты он индексирует на ура за неделю?

открытая многоязычная словарная база (http://tolmacz.ru)
serg mossine
На сайте с 03.07.2002
Offline
114
#1

Надпись в сортире.... "не льсти себе, подойди поближе".... :-)

Попробуйте не через 400-е решать а через 300-е. Вполне вероятно, поможет

Уважаемые участники! Если у вас вскочил чирей на жопе, либо нужно купить ноутбук, часы, трусы, выбрать ресторан и т.д., не стоит искать ответа здесь, попробуйте предварительно найти профильный ресурс. Поверьте, он есть. Задолбали. Орфографию, как и искусство кун-фу, настоящие мастера применяют лишь в исключительных ситуациях.
E
На сайте с 05.10.2005
Offline
172
#2

Да черт с ними с динамическими страницами. Они - второй вопрос. Но у меня по старой хтмльной привычке в каждом каталоге выложен свой реальный index.php. И на них даны ссылки с главной страницы. Почему же Яндекс даже их не индексирует?

MT
На сайте с 01.09.2002
Offline
108
#3

Ну вот я запустил своего робота по указанной ссылке:

root@fly:~$wget http://anton2ov.spb.ru/poe/81.php

--23:59:58-- http://anton2ov.spb.ru/poe/81.php

=> `81.php'

Resolving anton2ov.spb.ru... 217.106.232.14

Connecting to anton2ov.spb.ru[217.106.232.14]:80... connected.

HTTP request sent, awaiting response... 404 Not Found

23:59:59 ERROR 404: Not Found.

FINISHED --23:59:59--

Downloaded: 0 bytes in 0 files

Уверен что Яндекс получает тоже самое и понятно почему ничего не индексирует. Проверяйте что у вас там за скрипты работают и сделайте лучше через mod_rewrite, если есть такая возможность.

Проверил в броузере - все действительно показывается, но роботы вашу псевдостатику не понимают, увы....

Artisan
На сайте с 04.03.2005
Offline
374
#4
espada:
Но у меня по старой хтмльной привычке в каждом каталоге выложен свой реальный index.php. И на них даны ссылки с главной страницы. Почему же Яндекс даже их не индексирует?

Попробуйте согласно стандартам добавить / косую линию ко всем линкам ведущим на каталоги а еще лучше добавьте /index.php явное название файла ко всем линкам ведущим на каталоги.

www.leak.info / ДАРОМ линки конкурентов и забытых доменов
E
На сайте с 05.10.2005
Offline
172
#5

Блин, вот и надейся после этого на добрые советы. Ведь совет сделать так я прочитал здесь, на searchengines.ru, в статье про индексирование динамических страниц.

Способ, правда, был назван ламерским, но утверждалось, что он работает.

M.TULULU, спасибо за разъяснение.

E
На сайте с 05.10.2005
Offline
172
#6

Artisan, спасибо за идею

Artisan
На сайте с 04.03.2005
Offline
374
#7
espada:
http://anton2ov.spb.ru/santos/index.php
на него-то ведь прямая ссылка идет,

Я там нашел только линки без косой линии

которые выдают 301 Moved Permanently типа

http://anton2ov.spb.ru/santos

E
На сайте с 05.10.2005
Offline
172
#8

Да, я понял, спасибо. Просто свое сообщение написал до того как прочитал ваше.

Век живи - век учись.

А вообще-то я смотрю, уже все поисковики индексируют страницы с ? в УРЛе. Даже Апорт. Так что псевдостатика как бы и вовсе не нужна?

Artisan
На сайте с 04.03.2005
Offline
374
#9
espada:
А вообще-то я смотрю, уже все поисковики индексируют страницы с ? в УРЛе. Даже Апорт. Так что псевдостатика как бы и вовсе не нужна?

Бывают даже кривые броузеры типа WebTV например которые адреса со знаками вопроса не всегда понимают, робот поисковой системы может заблудиться в лишних параметрах, так что в любом случае чем больше адрес похож на адрес обычной страницы тем лучше.

MK
На сайте с 18.08.2005
Offline
126
#10

http://www.be1.ru/stat/?url=http%3A%2F%2Fanton2ov.spb.ru%2Fpoe%2F81.php

HTTP/1.1 404 Not Found

Попробуйте принудительно в скрипте написать

header("HTTP/1.0 200 Ok");

И еще раз проверьте с помощью вышеприведенной ссылки. Если будет 200, то страница проиндексируется. Согласен с тем, что лучше всеж сделать перенаправление через mod_rewrite.

нет
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий