Вернуться   Форум об интернет-маркетинге > >
Ответ
 
Опции темы
Старый 15.08.2005, 09:33   #1
Banned
 
Аватар для aka352
 
Регистрация: 23.03.2004
Адрес: Воронеж
Сообщений: 1,434
Репутация: 41103

По умолчанию Чистки базы?

Как известно, Яндекс публикует общую статистику своей базы, где указывается ее размер, число серверов и документов.
Периодически замечаю интересную вещь - база постоянно растет, а затем резко уменьшается. Если после прошлого апдейта в базе было 806784883 документа, то сегодня это число резко сократилось до 659927581 документа. Т.е. уменьшилась на 18% (!). Примерно 1,5-2 месяца назад было зафиксировано аналогичное уменьшение. Тогда "потери" составили около 12,7% Посколько ощутимых глюков такое резкое уменьшение объема базы не вызывает, следовательно это плановая "зачистка".
aka352 вне форума   Ответить с цитированием

Реклама
Старый 15.08.2005, 09:51   #2
Jangl
Banned
 
Аватар для Jangl
 
Регистрация: 21.02.2005
Адрес: Екатеринбург
Сообщений: 186
Репутация: 305
Отправить сообщение для Jangl с помощью ICQ

По умолчанию

Тоесть ты хочешь сказать, что сотрудники Я. сами удаляют часть базы? Не думаю, что в бан может уйти 18%, слишком уж много Я почему то склоняюсь, к глюку, так как даже вот на форуме видно, что у кажого 10 вылетел сайт, хотя не забанен или вылетела главная Не спокойное лето, видимо сотрудников Я. в отпуск отказались отправлять, вот они всем вебмастерам и решили отомстить, мол вы ездите, а мы нет
Jangl вне форума   Ответить с цитированием
Старый 15.08.2005, 09:51   #3
kittenk
Banned
 
Регистрация: 26.02.2004
Сообщений: 1,298
Репутация: 59620

По умолчанию

Интересно, никогда не замечал этого. А может у кого есть статистика хотя бы за полгода. Построить бы график - посмотреть, подумать....
kittenk вне форума   Ответить с цитированием
Старый 15.08.2005, 10:09   #4
aka352
Banned
 
Аватар для aka352
 
Регистрация: 23.03.2004
Адрес: Воронеж
Сообщений: 1,434
Репутация: 41103

ТопикСтартер

Jangl, никто не говорил о бане Как мне видится, в эти моменты происходит удаление документов, выдававших неоднократно 404 ошибку, т.е. прекративших существование. Если это так, то можно сделать вывод, что за месяц отмирает 7-9% сайтов/документов Рунета. Чистый прирост составил за последний период около 3%.
У меня есть данные за последние 14 апдейтов, сопровождавшихся изменением статистики Яндекса.
aka352 вне форума   Ответить с цитированием
Старый 15.08.2005, 10:25   #5
kittenk
Banned
 
Регистрация: 26.02.2004
Сообщений: 1,298
Репутация: 59620

По умолчанию

Я бы попросил эти данные в личку... если "наанализирую" что нибудь интересно поделюсь с общественностью.
kittenk вне форума   Ответить с цитированием
Старый 15.08.2005, 10:42   #6
aka352
Banned
 
Аватар для aka352
 
Регистрация: 23.03.2004
Адрес: Воронеж
Сообщений: 1,434
Репутация: 41103

ТопикСтартер

kittenk, скинул
aka352 вне форума   Ответить с цитированием
Старый 15.08.2005, 12:17   #7
Insane
Студент
 
Регистрация: 08.08.2005
Адрес: Красноярск
Сообщений: 23
Репутация: 12
Отправить сообщение для Insane с помощью ICQ

По умолчанию

Можно и мне тоже ?
Заранее благодарен.
Insane вне форума   Ответить с цитированием
Старый 15.08.2005, 13:43   #8
minaton
Препод
 
Аватар для minaton
 
Регистрация: 19.09.2004
Адрес: Москва
Сообщений: 1,129
Репутация: 59399
Отправить сообщение для minaton с помощью ICQ Отправить сообщение для minaton с помощью Skype™
Социальные сети Страница в Одноклассниках Профиль в ВКонтакте Профиль на Хабрахабре

По умолчанию

aka352, если это не секретные данные, опубликуйте здесь!
kittenk, обязательно поделитесь своим анализом или хотя бы график получившийся покажите
__________________
IBC Russia
minaton вне форума   Ответить с цитированием
Старый 15.08.2005, 13:48   #9
aka352
Banned
 
Аватар для aka352
 
Регистрация: 23.03.2004
Адрес: Воронеж
Сообщений: 1,434
Репутация: 41103

ТопикСтартер

Конечно секрета никакого нет Но не думаю, что можно сделать еще какие-то выводы.

Точных дат, когда снимались данные - нет. Следует исходить из рассчета - на 1 неделю приходится в среднем 2 обновления. Итого, данные за 7 недель.

Число документов в базе:
734379920
640835047
641388406
666452479
681189910
692368974
721471722
734024785
747366094
766884620
782854094
798411065
806784883
659927581 (сегодняшний апдейт)
aka352 вне форума   Ответить с цитированием
Старый 15.08.2005, 15:34   #10
minaton
Препод
 
Аватар для minaton
 
Регистрация: 19.09.2004
Адрес: Москва
Сообщений: 1,129
Репутация: 59399
Отправить сообщение для minaton с помощью ICQ Отправить сообщение для minaton с помощью Skype™
Социальные сети Страница в Одноклассниках Профиль в ВКонтакте Профиль на Хабрахабре

По умолчанию

У меня получилось вот что

Еще бы три-четыре месяца понаблюдать. Но уже сейчас можно увидеть, что в начале каждого месяца в базе Яндекса проводятся чистки документов.
minaton вне форума   Ответить с цитированием
Ответ



Опции темы

Быстрый переход


Регистрация Справка Календарь Поддержка Все разделы прочитаны