Пресс релиз рамблера

1 23
VT
На сайте с 27.01.2001
Offline
130
#21
Как некоторые уже, наверное, знают, робот Рамблера "стаскивает" страницы из Интернета в локальное хранилище, а вся последующая работа идет уже с этим хранилищем. Хранилище состоит из 50-мб кусков, в которых "свалены" сжатые HTML-ки.

Любопытно, а имеют ли кластера тематическую связь или документы хранятся хаотично? И все ли они являются равнозначными, то есть имеющими одинаковый приоритет обработки?

После того, как частичные индексы построены, запускается специальная программа "сливатор", которая параллельно читает отсортированные списки, из которых, собственно, и состоят индексы, и строит результирующий суммарный индекс.

А для часто обновляющихся сайтов случайно не собирается никаких особых частичных индексов? Если сумматор работает настолько хорошо и быстро, это было бы логичным решением.

Если интересно, могу аналогично расписать и без малого 7 миллионов страниц, которые наши роботы скачали 24 ноября.

Это интересно :)

AiK
На сайте с 27.10.2000
Offline
257
AiK
#22
Их можно спокойно взять из статистики top100 и попробовать расширить ими область видимости каждого сайта.
Также из статистического материала - наверняка у них есть статистика поля http-referrer запросов к кнопкам CY.

У! Как я отстал от жизни :) Объясните мне плиз неразумному, как вытащить в cgi скрипте предыдущий HTTP_REFERER без JavaScript? А то я всю жизнь страдал :) от того, что для скрипта счётчика в поле HTTP_REFERER _всегда_ заносится страница, с которой был вызван скрипт счётчика.

[Удален]
#23
Также из статистического материала - наверняка у них есть статистика поля http-referrer запросов к кнопкам CY.
Как я отстал от жизни Объясните мне плиз неразумному, как вытащить в cgi скрипте предыдущий HTTP_REFERER без JavaScript?

Я вообще-то имел ввиду, что Яндекс имеет статистику посещаемости ресурсов, на которых стоит кнопка. Тот же самый счетчик, только статистика закрыта от вебмастера.

mager
На сайте с 06.07.2001
Offline
122
#24
Качество каталогов здесь не обсуждаю, а с точки зрения трафикогенерации каталог Яндекса должен был, по идее, здорово подняться в логах.

Интересно, видно ли это по логам присутствующих на форуме сайтов?

наблюдается 3:1 в пользу Рамблера при одинаковых позициях в обоих каталогах....вообще трафик с top100 сильно зависит от категории, в которой находится сайт...жаль, что информация о популярности категорий top100 не распространяется

Микс-Юни (http://mixmarket.biz/doc/partners/uni/overview/?from=mager_se) - агрегатор партнерских программ, более 150 программ в одном интерфейсе Russian Affiliate Days (http://affdays.ru) - первая конференция по маркетингу с оплатой за результат, 4-5 октября 2012 г.
Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#25

Ну вот я смотрю на статистику клиента - порядка 220 человек в сутки с каталога Яндекса (сайт первый в своем разделе) и мизер с топ100 - правда, позиции несравнимы.

Впрочем, вчера я погорячился - для searchengines.ru это, как минимум, равноценные величины.

mager
На сайте с 06.07.2001
Offline
122
#26

говорю же, от категории сильно зависит...допустим, в категории "Реклама" большого трафика ждать не приходится, а вот в категории "Работа"....

AiK
На сайте с 27.10.2000
Offline
257
AiK
#27
жаль, что информация о популярности категорий top100 не распространяется

как говорится жалко у пчёлки :)

Сегодня самая популярная категория - Развлечения.

~12К показов первой страницы на сей момент. Работа ~1.5К, меньше чем вторая страница Развлечений (~2К)

А Реклама самый отсталый раздел - всего 150 показов.

Всего по разделам:

Развлечения: ~20К

Работа: ~2К

Реклама: ~300 - меньше только у Страхования.

Полагаю, что посетителей из показов каждый получит самостоятельно :)

mager
На сайте с 06.07.2001
Offline
122
#28
Развлечения: ~20К
Работа: ~2К
Реклама: ~300 - меньше только у Страхования.

могу сказать, что по разделу "Работа" это не соответствует истине. Посетителей оттуда только с первого места идёт больше, чем 2000.

AiK
На сайте с 27.10.2000
Offline
257
AiK
#29
Посетителей оттуда только с первого места идёт больше, чем 2000.

Сегодня за первую половину дня?

C
На сайте с 09.03.2002
Offline
55
#30
жаль, что информация о популярности категорий top100 не распространяется

http://top100.rambler.ru/cgi-bin/stats_top100.cgi?id=208383&page=4

1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий