Яндекс (занимательная арифметика)

12
[Удален]
2015

http://forum.yandex.ru/index.xhtml?pr=&id_note_forum=1030751&by_count_days=10®im=1&cur_page=1&by_count_page=75#ID_1030751

http://www.yandex.ru/chisla.html

Как писал на форуме Яндекса Илья Сегалович:
Мы запрашивали по 1 млн 600 тыс документов в день в агутсе
и по 2 миллиона в сентябре.

Сейчас (октябрь) начали запрашивать по 2 с половиной миллиона.

По идее стало быстрее.

Конечно, какой-то конкретный сайт может случайным образом
хуже обходиться.
Как писал на форуме Яндекса Илья Сегалович:
несколько месяцев подряд до августа включительно было все стабильно

Что мы имеем:

По данным Яндекс-числа:
Количество уникальных документов: 57 882 164

То есть, даже если предположить равномерную переиндексацию без добавления новых документов, то полное обновление происходило в среднем за 36 суток, при сентябрьской интенсивности - 29 суток, при заявленной октябрьской - 23.

Очевидно, за счет существующей неравномерности и добавления новых сайтов - реальные сроки еще больше.

Выходит, что с небольшим запасом на рост и добавление новых, для того чтобы выйти на цифру обновления раз в две недели, Яндексу надо довести интенсивность минимум до 4-4.5 млн документов в сутки, то есть увеличить на 80%. Интуиция подсказывает, что быстро они это сделать не сумеют.

Вот такие грустные мысли посещают.

BB
На сайте с 25.03.2002
Offline
31
#1

Рад всех приветствовать!

Отчего же такие грустные мысли?

Может быть интуиция все же подведет на этот раз и Яндекс достаточно быстро нарастит мощности? :)

Если исходить только из арифметики, то при таких темпах увеличения количества запрашиваемых документов, которые демонстрируются (рост на 20-25% в месяц), нужные объемы будут достигнуты через 3-4 месяца.

aktex.ru - аккумуляторный информационный портал (http://www.aktex.ru/)
LM
На сайте с 30.11.2001
Offline
71
LiM
#2

На самом деле, похоже, все еще грустнее.

У нашего сайта Яндекс не проиндексировал еще до конца все страницы, хотя новые появляются не так часто (т.е. на нем нет гостевух, форумов или чего подобного)... :( А ведь знает про сайт уже почти год.

С уважением, Андрей Хроленок. Загляни в FAQ по оптимизации и продвижению сайтов (http://www.seoman.ru/FAQ/) Анализатор страниц сайтов (http://www.seoman.ru/analizer/)
F
На сайте с 15.11.2000
Offline
116
#3
Как писал Interitus
Очевидно, за счет существующей неравномерности и добавления новых сайтов - реальные сроки еще больше.

Скорее всего, неравномерность (в сторону больших сроков) сказывается прежде всего на огромном числе редко обновляющихся страничек. Хотя когда-то Илья говорил, что период переиндексации Яндексом не зависит от частоты обновления сайта, какие-то регулирующие механизмы есть. Я не раз замечал, что новый сайт первое время переиндексируется часто, но если он перестает обновляться, робот потом может не приходить и 2 месяца. Поэтому, скорее всего, обновляющаяся часть рунета переиндексируется регулярно.

С уважением,

Александр Садовский.

LM
На сайте с 30.11.2001
Offline
71
LiM
#4
Как писал funsad

Я не раз замечал, что новый сайт первое время переиндексируется часто, но если он перестает обновляться, робот потом может не приходить и 2 месяца. Поэтому, скорее всего, обновляющаяся часть рунета переиндексируется регулярно.

А никто не замечал, как обстоят дела с сайтами, которые обновляются не так часто, но содержат много страниц? Страницы нашего сайта, в среднем, обновляется примерно раз в 1-2 месяца, но на нем настолько много страниц, что Яндекс вот уже почти год как не может обойти их все даже один раз - на некоторые заходил по нескольку раз, а про другие еще и не знает, т.к. не проиндексировал страницы, ссылающиеся на эти.

AA
На сайте с 16.04.2001
Offline
70
#5
funsad:
Илья говорил, что период переиндексации Яндексом не зависит от частоты обновления сайта, какие-то регулирующие механизмы есть.

Несомненно, такие механизмы есть. Предположу, что переиндексация зависит как от обновления, так и от популярности сайта у посетителей Яндекса. А сама база Яндекса обновляется очень неравномерно - база разделена на 4-10 сегментов с разной частотой обновления. Причем, число сегментов определяется скорее аппаратными, нежели идеологическими ограничениями.

Повторюсь, все это - на уровне предположения, я бы сам так делал.

С уважением, Антонов Александр.
[Удален]
#6
Как писал LiM
А никто не замечал, как обстоят дела с сайтами, которые обновляются не так часто, но содержат много страниц? Страницы нашего сайта, в среднем, обновляется примерно раз в 1-2 месяца, но на нем настолько много страниц, что Яндекс вот уже почти год как не может обойти их все даже один раз - на некоторые заходил по нескольку раз, а про другие еще и не знает, т.к. не проиндексировал страницы, ссылающиеся на эти.

А что мешает засабмитить все страницы ручками? Я имею ввиду, что надо сабмитить на только страницы с ссылками на другие страницы (карту сайта), а именно все страницы. Я как-то добавил в Яндекс страницу с ссылкой на мой сайт (кроме того Яндексу были известны другие страницы с ссылками на мой сайт). Прождал около месяца - Яндекс мой сайт не проиндексировал и даже не знал ссылку на него. Добавил страницы своего сайта ручками - в течении недели все стали доступны для поиска. Теперь другая проблема - вот уже месяц будет, как ВИЦ этого сайта = 0.00 :( Когда пересчитает? :angry:

LM
На сайте с 30.11.2001
Offline
71
LiM
#7
Как писал dpol

А что мешает засабмитить все страницы ручками?

Он издевается... :(

Делал я это. После того, как в прямом смысле ручками (!) было внесено в Яндекс более 1500 страниц дважды (!) за два месяца я сдох.

Кто не делал подобные "геройские поступки", советую не пробовать - после 200-й странички голова начинает тупеть...

На данный момент меня относительно устраивает то, насколько Яндекс сотоварищи проиндексировал сайт. "Индексации будущего" там быть не может, потому процесс сходящийся. :)

Пока же я занимаюсь более эффективными для посещаемости вещами, чем попадение в поисковые базы...

Но вопрос остается в силе.

Sir[MAI]
На сайте с 22.10.2002
Offline
147
#8

LiM

Пока же я занимаюсь более эффективными для посещаемости вещами, чем попадение в поисковые базы...

Сорри за офтопик, а поподробнее можно?.... (для новичка) :-)

С уважением, Сергей
LM
На сайте с 30.11.2001
Offline
71
LiM
#9

Ничего нового: уникальность наполнения (контента), ссылки с качественных источников и удобство использования (юзабилити)...

Срабатывает медленно, зато надежно держит достигнутые результаты.

Думаю, не стоит говорить, насколько важна подобная работа для молодого проекта. Как, впрочем, и для любого другого, у которого нет подобного запаса.

mnt
На сайте с 11.11.2002
Offline
107
mnt
#10
Как писал AlexA

Несомненно, такие механизмы есть. Предположу, что переиндексация зависит как от обновления, так и от популярности сайта у посетителей Яндекса. А сама база Яндекса обновляется очень неравномерно - база разделена на 4-10 сегментов с разной частотой обновления. Причем, число сегментов определяется скорее аппаратными, нежели идеологическими ограничениями.
Повторюсь, все это - на уровне предположения, я бы сам так делал.

хм..старанно откуда у тебя такие цифры 4-10? Илья вроде бы говорил что ~30 или я ошибаюсь?

дорого куплю ссылки с хороших жирных русскоязычных авто сайтов.
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий