А в чём получается чепуха? И почему печальная?
Внутреннее тестирование поисковиков мы ведём постоянно, по нашей собственной методике. Я предупредил слушателей, что это внутренние данные, на нашей совести, и что сами абсолютные цифры не имеют отношения к здравому смыслу, а показывают относительный рост релевантности.
Методика близка к той, что вывешивалась на данном форуме, хотя выборки поменьше и не содержат частотных запросов - ресурсов жалко.
На больших выборках абсолютные значения и результаты сравнения могут несколько отличаться.
Качественные же выводы как раз мне кажутся правильными и закономерными: релевантность поисковиков Апорта и Яндека в течение года сначала выросла, а потом менялась не сильно; Апорт по релевантности - по-прежнему самый лучший, это происходит, видимо, по двум причинам - вычисление запросов лучше (в частности, ссылочное ранжирование), во-вторых, база меньше, то есть мусора меньше.
Рамблер почти догнал Яндекс по релевантности, несколькими рывками в течение осени 2000 года и января-февраля 2001 года, полнота же и актуальность базы у Яндекса пока лучше.
Игорь Ашманов.
Большой индекс Рамблера теперь действительно имеет координаты слов и учитывает их. Вычислитель запроса сейчас отлаживается.
А вот контентные разделы - Наука, прочие - лежат в базе данных и обслуживаются совсем другой искалкой, в которой с ранжированием похуже. Но там и контента поменьше. Мы её переберём со временем.
Ну, я тут ни при чём. Там много чего переврали, видимо, это неизбежно. Например, выдали число уникальных посетителей поиска за посетителей всего Рамблера. Ну и замешали свои слова в мои во многих местах.
Но про Апорт я лично сказал, что у него самая высокая релевантность по нашей внутренней оценке. Там эта табличка есть.
Из сообщения на Ленте видно, что высказывание "Апорт - аутсайдер " - это оценка Нетоскопа".
Это их мнение, и их ответственность. Я бы такого не сказал потому, что, во-впервых, маркетингом такого рода не занимаюсь, а во-вторых, за такие вещи просто нельзя поручиться - в Интернете всякое может случиться и очень быстро.
Про тестирование: ничего не знаю про тестирование. Это ещё один пример трансформации всего, что говоришь, в прессе.
Мы выставили новую версию просто в общее пользование, там и тестируй.
В ней ещё есть ошибки, релевантность будет повышаться, полноту и свежесть индекса надо улучшать, ну и так далее. Эта отладка будет тянуться весь март и середину апреля.
Но ядро, наконец, новое, полностью в наших руках, теперь пойдёт веселее.
Игорь.
Рамблер пока с редиректом обращается так: идёт на ссылку-1, потом идёт по редиректу на новую ссылку-2, индексирует документ и заносит ссылку-2 в список своих URL Для обхода. А старую ссылку-1 - с редиректом - выбрасывает из своих списков. Таким образом, св следующий раз он пойдёт по новой ссылке-2.
А если ссылка-2 формируется с помощью Ява-скрипта, Рамблер вообще по ней не пойдёт, потому что он не исполняет и не парсирует скрипты.
В дальнейшем поведение паука может измениться, поскольку мы его модернизируем.
Положим, я как раз отказывался устраивать дискуссии - см. выше. Они бессмысленны, как я и говорил. Ну, вот первый гонец из Яндекса появился и с гневом всё отверг. При этом тонко подверг сомнению объективность и интеллигентность предыдущего оратора. Я в отчаянии - меня разоблачили!
А что ещё он мог сделать, как вы думаете?
Все остальные с ходу бросятся рубиться и сделают то же самое. И что с того?
Эпизод с двумя счётчиками и посмешище с премией это всё равно из истории не вычеркнет.
Что касается Сегаловича - я его знаю и уважаю со времён ещё до появления Яндекса (было и таке время), по конференциям. Он, скорее всего, сомнительным PR-ом не занимается и в сговоры со Спайлогом, вероятно, не вступает, это я и хотел сказать.
Замечу, что, по моему мнению, Яндекс - очень хорошая поисковая машина, за два с лишним года ребята Сегаловича проделали хорошую работу, Яндекс неплохо развивается, Интернет-бизнес они понимают правильно. Ну, методы раскрутки - это их выбор.
Тут нет почвы для дискуссии.
И не это было поводом для реплики - а поводом стала ссылка на статистику Спайлога, которая содержит множество дыр и сомнительных цифр.
Лично я далее в этих дискуссиях участвовать не буду, поскольку истину здесь не установишь, а уровень потенциальных оппонентов из Спайлога мне хорошо известен.
Быстро дойдёт просто до ругани и открытого вранья.
Короче, можете бить в рельс и трубить общий сбор, Grey, если хотите, может, кто и придёт, а я пойду погуляю.
Сейчас про клики ответить не могу - нужно спросить у разработчиков, а они сейчас отлаживают новый поиск под нагрузкой.
Клики действительно проходят через нас, но статистикой мы давно не занимались, хотя логи есть.
Мы сейчас начали готовить отчёт по поисковой системе, через некоторое время данных у меня будет больше.
Что касается падения трафика в зависимости от позиции, то обычно это гипербола (закон Ципфа) - 1/n. На самом деле - куски гиперболы с резкими падениями на следующий уровень из-за того, что выдача разбита на страницы.
Та картина "террас" трафика, кстати, наблюдается в Тор100.
У нас в среднем смотрят 1,8 страницы, это я могу сказать довольно точно.
Интересно заметить, что чем релевантнее выдача, тем меньше страниц должны по идее смотреть пользователи.
Игорь Ашманов, Рамблер.
Мы-то будем продолжать улучшать статистику - сейчас выставили обсчёт сайтов в целом, в том числе и рамблеровских, далее последуют "длинные" статистики, ядра аудитории, уникальные посетители, прочее.
По поисковым запросам тоже кое-что появится, я думаю.
А вот что имел в виду в соседнем топике AiK, говоря:
"Кстати, на Яндексе счётчик Спайлога очень сильно модернизирован и он считает всех подряд." ?
Если уж делать исследование/доказательство, стоит его спросить про это, я думаю.
Про два счётчика - конечно, их сейчас нет. Я упомянул октябрьскую историю, как иллюстрацию нравов. Мы тогда установили на Рамблер счётчик Спайлога на месяц и Спайлог начал падать каждый день от нагрузки. Кроме того, Рамблер сразу оказался первым с сильным отрывом и Андреев принялся увещевать меня по телефону, чтобы мы разбили ресурс на подресурсы. Мы ответили, что у него нет никаких правил, так что претензий быть не может. Затем он собрал нас, чтобы выработать "правила" и вообще формально получить статус главного счётчика страны.
На собрании мы указали ему и Воложу на то, что у Яндекса просто стоит ДВА счётчика на странице. Они оба в голос закричали, что этого быть не может, и тогда Тутубалин тут же на большом экране показал эти два счёчика, принародно. Получился конфуз, но с них - как с гуся вода.
Вот и всё.
Считает ли Спайлог переходы между своими одинаковыми счётчиками, при этом с нестандартным URL или referrer - это, как Вы понимаете, вопрос не технический. Хозяин - барин, если хотят посчитать - посчитают.
Что касается Апорта, счётчик они поставили недавно, видимо. Одно время упирались.
Просто сейчас, лучше зная Андреева, я не сомневаюсь, что он будет подкручивать что угодно, если это ему будет выгодно. А с Яндексом хорошей иллюстрацией этого принципа является Интел-премия. Известна даже примерная цена премии - всего лишь $5000, известна, поскольку её требовали со многих на рынке. То есть Яндекс "пожертвовал" , насколько можно судить, примерно $30,000. И никому технически не помешало голосование, где по всей видимости были другие результаты.
Это я тому, какие нравы господствуют в Интернет-маркетинге. Меня они не обижают и не задевают - как сказано, эти господа "уже получают награду свою".
Если Вам удастся объяснить странные цифры техническими рассуждениями - ну что же, хорошо. Я ведь тоже пытался это сделать в прошлой дискуссии, в предположении что Спайлог считает честно. Хотя при любой детальности исследования это всё равно будут предположения, умозрительные объяснения фактов, видимых только извне, как в астрономии.
В этом смысле единственным сколько-нибудь доказательством достоверности или накрутки могли бы быть полные логи счётчика, но их никто не отдаст, я думаю.
В любом случае хорошо хоть, что теперь это называется более близко к пердмету - "трафикогенерация", а не "популярность поисковых машин", как в прошлой дискуссии.
А какой в этом смысл? Это же вопрос не технический, а этический. Если ребята этим занимаются, бессмысленно их стыдить. А они занимаются, я в этом уверен.
А выслушивать их аргументы, почему они белые и пушистые - для чего?
Я своего мнения не изменю, а на потеху публике...
Я просто не удержалсяот комментария. Если он кому-то окажется полезным для построения более резкой картины мира - хорошо.
Я спрашивал Андреева про учёт внутреннего трафика в октябре (первый приступ инвестиционного голода у Спайлога) и он горячо отрицал. Мы решили поверить, хотя нас весь сентябрь они старались засудить - пытались разбить на под-ресурсы, заставляли снять счётчик с результатов поиска, и так далее, лишь бы общая сумма трафика была поменьше. Но тогда они ещё держали лицо.
А с тех пор мы ещё дважды рассматривали покупку их компании, и каждый раз всё выглядело ещё более неприглядно.
В январе нам предложили просто "куклу" - пустышку, из которой вывели все права на интеллектуальную собственность и всех разработчиков, а оставили одни долги (на сотни тысяч уругвайских эскудо).
Причём готовящийся обман ("кидалово") был такой явный и грубый, что тут-то я и понял, что с них станется просто-напросто подкручивать Яндекс, с которыми у них давно совет да любовь. По поводу интимных отношений Вы вспомните, что Спайлог в последний момент заменил Народ в номинации "Открытие года", так что даже Народ повисел пару дней на сайте Премии, как квази-победитель. То есть они там торговались - между своими.
Так что технически тут обсуждать нечего. Я просто назвал вещи их именами - а спорить-то о чём?
Честный разработчик Илюша Сегалович будет всё горячо отрицать - ну так "черный" маркетинг такого рода и не его дело.
А двадцатилетние ребята из Спайлога и так врут на каждом шагу - и про количество участников (выдавая 50К зарегистрированных за действующих) и про процент покрытия Рунета, и пр., и пр.
Эта та причина, почему мы пока не выставляем на Рамблере свои тематические форумы, хотя технология готова - нужны искренне увлечённые модераторы, без них ни форумы, ни чаты толком не живут. Это, впрочем относится к производству любого контента (почему его и нельзя украсть по большому счёту).
Так что Вам придётся всё время помешивать, а иначе затвердеет.
Насчёт РИФа - Иванов не смог поехать, увы; прислал интересную статью, но зачитывать её на секции, в общем, неудобно - не тот формат заседания. Был бы он "вживую", мы бы объявили доклад.