funsad

Рейтинг
116
Регистрация
15.11.2000

<font face="Verdana" size="2">Originally posted by Nicholas:
Что-то я не очень разобрался как они это исследовали!..</font>

В основной части исследования и разделе методологии приведено описание. Если вкратце -- искались 25 редких терминов, количество найденных страниц определило относительный объем базы поисковиков. Для определения абсолютного объема базы полученные числа умножались на объем базы Northern Light и FAST, так как язык запросов NL позволяет получить точное число документов в базе (term OR NOT term). Аналогичный прием есть и у FAST, но Greg Notess не имеет права его открывать. Итоговые показатели -- грубая оценка объема базы поисковиков.

С уважением,

Александр Садовский.

<font face="Verdana" size="2">Originally posted by wolf:
Во всяком случае, он заявляет, что проиндексировал 1 495 332 308 страниц, в то время как Гугль говорит о наличии 1 387 529 000 страниц в своей базе</font>

Согласно исследованию Searchengineshowdown от 14 августа 2001, у Google проиндексировано 730 миллионов страниц, WISEnut -- 510 (между ними поместился FAST с 552 миллионами).

С уважением,

Александр Садовский.

<font face="Verdana" size="2">Originally posted by Zprom:
а вот как это сделать даже понять не могу, хотя прочитал все на этом сайте...</font>

А что Вы уже сделали? И что получилось? Как Вы думаете, почему? Почему у конкурентов все получается? А что надо сделать Вам, чтобы достичь нужного результата?

Рецепт успеха очень простой: думать, анализировать, размышлять. Вам известны запросы, по которым хочется встать на видном месте? Известны, равно как и сайты, которые входят в первую десятку по данным запросам. Особенность работы с html такова, что скрыть код интересующего Вас сайта нереально (клоакинг исключаем, так как это довольно редкая вещь и наказуемая). Следовательно, все необходимое для анализа есть, неизвестен только алгоритм поисковика.

Посмотрите, как анализирует Артем Шкондин код сайтов в своей рассылке Измерение релевантности. Посмотрите на сообщения форума, как можно простейшими статистическими методами выяснять интересующие закономерности и взаимосвязи -- например, как определить объем базы поисковика или методика searchengineshowdown, взаимосвязь CY Яндекса и CI Апорта и т.д.

А после того как Вы выложите на форуме все установленные Вами закономерности с доказательствами и обоснованием, которые почему-то сбоят и не дают желаемого результата, мы вместе может попробовать найти ошибку. А разговор в стиле "понять не могу" неконструктивен.

С уважением,

Александр Садовский.

<font face="Verdana" size="2">Originally posted by Sad Spirit:
У кого-нибудь есть идеи --- почему так?</font>

Думаю, дело в случайности -- разном числе ссылок, известных поисковикам. Я проверил, CY и CI Апорта коррелируют, хотя и не так сильно, как хотелось бы (r=0,77). Вот график распределения CY и CI для 62 сайтов разной тематики:

Что касается выдачи Апортом одинакового числа ссылок для обоих сайтов, думаю, здесь сказывается какое-либо ограничение Апорта по времени поиска или по числу ссылок. (Как в обычном поиске он ограничивается 2000/4000 документов.) Иначе получается нелогичность: для сайта РБК (CI=1372) находится 162 ссылающихся сайтов, для сайта Яндекса (CI=150) находится 590 ссылающихся сайтов, и это не единственная нестыковка.

С уважением,

Александр Садовский.

[This message has been edited by funsad (edited 01-09-2001).]

<font face="Verdana" size="2">Originally posted by AiK:
Поздравляем уважаемого Gray'я с его 27-м днём рождения. Желаем всяческих успехов и процветания этого форума.</font>

Неплохо бы поздравить Грея и с предыдущими 26-ю ДР.

P.S. С радостью присоединяюсь к поздравлениям.

<font face="Verdana" size="2">Originally posted by iseg:
Хорошо бы все часто задавемые вопросы и ответы на них вынести в FAQ. А то одни и те же темы по несколько раз обсуждаются.</font>

Согласен с Ильей. Поскольку поиск на форуме работает медленно, а русские запросы не понимает и вовсе, затрагиваемые новичками темы вынужденно повторяются. (К слову, довольно часто при необходимости найти что-либо на форуме я ищу в базе Яндекса, а не поиском форума.)

Безусловно, FAQ -- всегда закостеневшая истина, в отличие от повторного обсуждения, и FAQ требует периодического обновления. Поэтому можно сделать промежуточный вариант -- в FAQ проставить только ссылки на соответствующие ветки форума, а не сами ответы. И Грею работы меньше, и FAQ есть.

С уважением,

Александр Садовский.

<font face="Verdana" size="2">Originally posted by mager:
Где найти такие программы(желательно бусплатные), чтобы узнать, с
каких поисковиков и по каким запросам приходят на твой сайт.
Или бесплатный сыр только в мышеловке?
</font>

Самое простое решение -- поставить счетчик на сайт. Русские поисковики понимает SpyLog. С недавних пор -- и счетчик PING. Анализаторы логов тоже могут помочь, но они, скорее всего, будут знать только зарубежные поисковики.

С уважением,

Александр Садовский.

[This message has been edited by funsad (edited 27-08-2001).]

<font face="Verdana" size="2">Originally posted by Nicholas:
Может я что-то пропустил, но я только что заметил русский баннер (рекламную сслыку) на Google в результатах поиска, по запросу "hosting". Это уже давно началось?</font>

Реклама 350mb.ru? По слову "hosting" я видел ее еще 8 июля. Что касается геотаргетинга на Google, он есть, судя по статье, как минимум с 9 июня 2001.

С уважением,

Александр Садовский.

<font face="Verdana" size="2">Originally posted by Vyacheslav Tikhonov:Здесь лежит новая версия анализатора: http://www.topping.com.ua/position/</font>

1. Несколько раз случалось, что скрипт перекидывал меня на Яндекс (результаты поиска были нулевые, кодировка страницы КОИ-8). Закономерность не отследил.

2. Неплохо бы сделать выдачу информации по мере поиска, а то пару раз скрипт обрывался по таймауту.

3. Были бы удобны кнопки "Select All", "Deselect All".

4. Неплохо бы поисковики разделить на две колонки -- русскоязычные и чисто украинские.

С уважением,

Александр Садовский.

У меня все нормально по обоим запросам.

Всего: 1503