Чистки базы?

123 4
[Удален]
4652

Как известно, Яндекс публикует общую статистику своей базы, где указывается ее размер, число серверов и документов.

Периодически замечаю интересную вещь - база постоянно растет, а затем резко уменьшается. Если после прошлого апдейта в базе было 806784883 документа, то сегодня это число резко сократилось до 659927581 документа. Т.е. уменьшилась на 18% (!). Примерно 1,5-2 месяца назад было зафиксировано аналогичное уменьшение. Тогда "потери" составили около 12,7% Посколько ощутимых глюков такое резкое уменьшение объема базы не вызывает, следовательно это плановая "зачистка".

[Удален]
#1

Тоесть ты хочешь сказать, что сотрудники Я. сами удаляют часть базы? Не думаю, что в бан может уйти 18%, слишком уж много :) Я почему то склоняюсь, к глюку, так как даже вот на форуме видно, что у кажого 10 вылетел сайт, хотя не забанен или вылетела главная :) Не спокойное лето, видимо сотрудников Я. в отпуск отказались отправлять, вот они всем вебмастерам и решили отомстить, мол вы ездите, а мы нет :D

[Удален]
#2

Интересно, никогда не замечал этого. А может у кого есть статистика хотя бы за полгода. Построить бы график - посмотреть, подумать....

[Удален]
#3

Jangl, никто не говорил о бане :) Как мне видится, в эти моменты происходит удаление документов, выдававших неоднократно 404 ошибку, т.е. прекративших существование. Если это так, то можно сделать вывод, что за месяц отмирает 7-9% сайтов/документов Рунета. Чистый прирост составил за последний период около 3%.

У меня есть данные за последние 14 апдейтов, сопровождавшихся изменением статистики Яндекса.

[Удален]
#4

Я бы попросил эти данные в личку... если "наанализирую" что нибудь интересно поделюсь с общественностью.

[Удален]
#5

kittenk, скинул

I
На сайте с 08.08.2005
Offline
9
#6

Можно и мне тоже :) ?

Заранее благодарен.

С уважением, Максим Постников
minaton
На сайте с 18.09.2004
Offline
135
#7

aka352, если это не секретные данные, опубликуйте здесь! :)

kittenk, обязательно поделитесь своим анализом или хотя бы график получившийся покажите :)

[Удален]
#8

Конечно секрета никакого нет :) Но не думаю, что можно сделать еще какие-то выводы.

Точных дат, когда снимались данные - нет. Следует исходить из рассчета - на 1 неделю приходится в среднем 2 обновления. Итого, данные за 7 недель.

Число документов в базе:

734379920

640835047

641388406

666452479

681189910

692368974

721471722

734024785

747366094

766884620

782854094

798411065

806784883

659927581 (сегодняшний апдейт)

minaton
На сайте с 18.09.2004
Offline
135
#9

У меня получилось вот что

Еще бы три-четыре месяца понаблюдать. Но уже сейчас можно увидеть, что в начале каждого месяца в базе Яндекса проводятся чистки документов.

[Удален]
#10

Как вариант, стоит привязываться не ко времени (периоду), а к количеству апдейтов, через которое происходит чистка

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий