некоторые наблюдения за выпадением - возможно это кому-то будет полезно :)

123
praide
На сайте с 20.07.2007
Offline
269
#11
flashlight:
В личку могу скинуть примеры, это не мои сайты.
так эти 70 твои сайты?

Это сайты , которые просили посмотреть коллеги (проблемы были по выпадению) и с форума.

"Наши летатели идут к смерти верным и скорым шагом." Антуан де Сент-Экзюпери Возьму пару проектов на продвижение. По себестоимости возьму на продвижение"песочный" сайт.
flashlight
На сайте с 22.09.2006
Offline
137
#12
praide:
Это сайты , которые просили посмотреть коллеги (проблемы были по выпадению) и с форума.

И, я так понимаю, предположение о выпадении было увязано с неуникальностью контента? а как насчет контрольной группы к каждому этому сайту по таким напр. показателям как

  • хостинг
  • движок
  • чпу

в количестве не менее 5-ти сайтов? если этого нет, то даже по 70 сайтам неправомерно выдвигать предположение о связи неуникальности контента и выпадения части страниц

сытый кот крепче спит
Skie
На сайте с 14.10.2006
Offline
161
#13
flashlight:
ЧПУ не указывается как причина, но игра с ним приводит к возвращению в индекс(рабочая гипотеза).

м.б. такой вариант, при включении ЧПУ у сайта появляются новые страницы и робот просто их индексирует. Ведь старые (без ЧПУ) при этом не возвращаются в индекс, поскольку их уже не существует.

Или что-то происхолит иначе?

flashlight
На сайте с 22.09.2006
Offline
137
#14
Skie:
м.б. такой вариант, при включении ЧПУ у сайта появляются новые страницы и робот просто их индексирует. Ведь старые (без ЧПУ) при этом не возвращаются в индекс, поскольку их уже не существует.Или что-то происхолит иначе?

еще раз попробую обрисовать гипотезу: выпадение части страниц просиходит не по

  • неуникального контента
  • продажных ссылок
  • наличия ЧПУ
но по причине каких-то особенностей робота\алгоритма, который таки считывает в любом случае положенное количество страниц, но не вносит их в индекс по какой-то причине в индекс. Игра с включением-выключением ЧПУ иногда приводит к тому, что сайт возвращается в индекс.

Т.е. - выпадение согласно предположению исключительно техническая причина, и скорее всего кроется в несовершенности сканирования(или алгоритма обработки) для сайтов на PHP.

PS (про "уникальность") ради показательного прикола такой факт - есть такой компонент на джумле - календарь. Типа ежедневника. Так вот на сайте, запущенном 2 м-ца назад робот нащупал его, и начал добавлять его страницы от апа к апу по 1000 примерно. Сейчас в индексе 5000 страниц месяцов и дней недели аж до 2150 года кажется :)

SR
На сайте с 12.10.2007
Offline
10
#15

хтмл тоже выпдает. По ТИЦ нет связи? например все ниже 50ти?

Например: бэкапить такой мусор яше мощностей жалко, или религия (ну может управление БД) не позволяет. Легла база таких - хер с ней. Само естественным путем проиндексируется потом. Как тупой вариант. ЗАодно и выдача чище.

satellitpro.ru (/ru/forum/127372) - сателлиты. профессионально.
di_max
На сайте с 27.12.2006
Offline
262
#16
flashlight:
Игра с включением-выключением ЧПУ иногда приводит к тому, что сайт возвращается в индекс.

Извините, но ЛОГИ-то Web-сервера что показывают, в плане индексации роботом?

flashlight:
Т.е. - выпадение согласно предположению исключительно техническая причина, и скорее всего кроется в несовершенности сканирования(или алгоритма обработки) для сайтов на PHP.

А здесь не путайте следствие с причиной!

Робот понимает только HTML-файл. И ему перпендикулярно, чем и из чего он сгенерирован.

Следовательно - проблемы не в роботе, а в работе ваших PHP-скриптов.

flashlight:
PS (про "уникальность") ради показательного прикола такой факт - есть такой компонент на джумле - календарь. Типа ежедневника. Так вот на сайте, запущенном 2 м-ца назад робот нащупал его, и начал добавлять его страницы от апа к апу по 1000 примерно. Сейчас в индексе 5000 страниц месяцов и дней недели аж до 2150 года кажется

Вот Вам и пример бажности скриптов!

Откуда робот мог узнать другие URL страниц, если не со страниц генерируемых этим же бажным скриптом.

Имхо, ну не телепатические способности робота к этому привели... ;)

// Все наши проблемы от нашего не знания...
orphelin
На сайте с 02.07.2006
Offline
261
#17
satellitpro.ru:
хтмл тоже выпдает. По ТИЦ нет связи? например все ниже 50ти?

Например: бэкапить такой мусор яше мощностей жалко, или религия (ну может управление БД) не позволяет. Легла база таких - хер с ней. Само естественным путем проиндексируется потом. Как тупой вариант. ЗАодно и выдача чище.

иногда лучше жевать, чем говорить.. выпадает по тицу..

flashlight
На сайте с 22.09.2006
Offline
137
#18
di_max:
Извините, но ЛОГИ-то Web-сервера что показывают, в плане индексации роботом?

логи показывают, что робот проходит по всем урлам регулярно и тщательно!

di_max:
А здесь не путайте следствие с причиной!
Робот понимает только HTML-файл. И ему перпендикулярно, чем и из чего он сгенерирован.
Следовательно - проблемы не в роботе, а в работе ваших PHP-скриптов.

допустим, это так. Но тогда почему робот Google начисто лишен перпендикулярности и параллельности, отрабатывая все четко, ясно, безупречно? Он исходит из других принципов? Принципов геометрии Лобачевского?

di_max:
Вот Вам и пример бажности скриптов!
Откуда робот мог узнать другие URL страниц, если не со страниц генерируемых этим же бажным скриптом.Имхо, ну не телепатические способности робота к этому привели... ;)
Или бажности алгоритмов Яндекса? Когда есть, с чем сравнить, и это сравнение, увы не в пользу Яши.
satellitpro.ru:
хтмл тоже выпдает. По ТИЦ нет связи? например все ниже 50ти?
Например: бэкапить такой мусор яше мощностей жалко, или религия (ну может управление БД) не позволяет. Легла база таких - хер с ней. Само естественным путем проиндексируется потом. Как тупой вариант. ЗАодно и выдача чище.
здесь сказать сложнее, ввиду отсуствия достаточного количества данных, но тоже есть подозрения, что что это не так. Море нулевых по параметрам сайтов успешно стоят в индексе при тех же условиях, что и выпадающие, более высокие.
SR
На сайте с 12.10.2007
Offline
10
#19

orphelin, я всего лишь сделал допуск что база учитывает тиц при сегментации. И кусок базы с сайтами с низким ТИЦ навернулся. Где я неправ?

Кусок базы с низкорейтинговыми сайтами. Которым уделяется меньше внимания по принципк - ну и хрен с ними.

sb1982
На сайте с 28.03.2007
Offline
278
#20

выпало несколько сайтов 2х тематик. тиц 100-200. контент 90% уникальный, 100 страниц на каждом, некоторые без сапы. в личку могу показать серьёзному человеку - обсудим.

Собираю поисковый трафик
123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий