funsad

Рейтинг
116
Регистрация
15.11.2000

Originally posted by E:
Насколько обоснованы могут быть претензии к поисковику в воровстве информации и чем это может грозить, если дойдет до суда?

Если робот поисковика понимает и следует указаниям из robots.txt, то поисковик выиграет суд. Он все делает корректно -- если не хотите индексировать, запрещайте.

С уважением,

Александр Садовский.

Originally posted by Keva:
Надо взять любую из них и ответить на предлагаемые Кубком Яndex'а двадцать вопросов, используя три наши русские поисковые машины. В каждом случае следует отмечать для себя, каким по счету в выдаче был документ, содержащий правильный ответ на вопрос, и сколько (визуально) мусора было на первой странице.

Андрей, я участвовал в первом Кубке, я участвовую во втором. И, естественно, еще до начала Кубка я тестировал 4 поисковика на предмет того, стоит их использовать или нет. Так вот, я держу открытыми ДВА окна с Яндексом, одно с Google, а Апорт и Рамблер держу только на всякий случай, который происходит раз в 50-100 вопросов. И знаете, баллы набираю неплохие.

Это не значит, что Рамблер ужасен, просто он не годится для сложного и/или быстрого поиска (а это довольно редкая задача). Если по запросам, где слова тесно связаны, и где известна точная формулировка Рамблер дает вполне пристойный результат, то как только речь заходит о нечетком поиске или сложных соотношениях между важностью слов, он полностью пасует перед Яндексом.

Есть у Рамблера и сильные стороны, например, поиск сложных сокращений -- Яндекс тут порою бессилен. Но это, увы, слишком редкая задача.

Так что при сравнении сквозь призму Кубка по поиску Яндекс легко побеждает Рамблер.

С уважением,

Александр Садовский.

[This message has been edited by funsad (edited 28-11-2001).]

Originally posted by Keva:
Надо взять любую из них и ответить на предлагаемые Кубком Яndex'а двадцать вопросов, используя три наши русские поисковые машины. В каждом случае следует отмечать для себя, каким по счету в выдаче был документ, содержащий правильный ответ на вопрос, и сколько (визуально) мусора было на первой странице.

Андрей, я участвовал в первом Кубке, я участвовую во втором. И, естественно, еще до начала Кубка я тестировал 4 поисковика на предмет того, стоит их использовать или нет. Так вот, я держу открытыми ДВА окна с Яндексом, одно с Google, а Апорт и Рамблер держу только на всякий случай, который происходит раз в 50-100 вопросов. И знаете, баллы набираю неплохие.

Это не значит, что Рамблер ужасен, просто он не годится для сложного и/или быстрого поиска (а это довольно редкая задача). Если по запросам, где слова тесно связаны, и где известна точная формулировка Рамблер дает вполне пристойный результат, то как только речь заходит о нечетком поиске или сложных соотношениях между важностью слов, он полностью пасует перед Яндексом.

Есть у Рамблера и сильные стороны, например, поиск сложных сокращений -- Яндекс тут порою бессилен. Но это, увы, слишком редкая задача.

Так что при сравнении сквозь призму Кубка по поиску Яндекс легко побеждает Рамблер.

С уважением,

Александр Садовский.

[This message has been edited by funsad (edited 28-11-2001).]

Originally posted by E:
Не грозит ли мне чем-либо использование мата в keywords и title некоторых страниц?

Грозит. Тем, что пользователи, использующие Family.Yandex или любой другой поисковик со включенным фильтром "неприличности", не найдут сайт, даже если он будет сверхрелевантен. Каков процент таких пользователей, я не знаю, но берусь предположить что около 1% у нас и около 5-10% на западе, где фильтры или включены по умолчанию (FAST), или вынесены на главную страницу (AV).

С уважением,

Александр Садовский.

Originally posted by Storm:
Напрашивается вывод об особом отношении к бесплатным хостерам.

Не замечал такого, обычное отношение. Один из моих сайтов расположен на бесплатном хостинге (Newmail). Ссылающихся серверов не менее 109, а CY=104.

С уважением,

Александр Садовский.

Originally posted by JuriC:
А что будет, если ссылок на Гоогле понаставить на сайте?

Ничего не будет. От того, что я стану носить футболку с надписью "McDonalds", меня кормить бесплатно в этой забегаловке не станут. Вас, подозреваю, тоже, хотя им выгодно, чтобы Вы носили такую футболку.

А еще такой момент - почему Гоогле имеет максимальный PR? Да потому, что все страницы Гоогле второго и далее уровней имеют ссылки на центральную страницу - вот и мы так будем делать - на всех наших страницах ставим ссылки на http://google.com

Классический пример, как из верной посылки можно получить неправильный вывод. На всех наших страницах надо ставить ссылки на НАШУ главную страницу.

В качестве примера взгляните на вторую страницу топика "чемпионат СССР по Гоогле". Она на этом форуме одна из немногих, которые имеют PR=5/10. Почему именно она?

Я уже объяснял , почему она. За счет большого числа ссылок на страницах searchengines.ru на нее.

С уважением,

Александр Садовский.

Originally posted by E:
Мне бы просто хотелось знать, насколько сильно отразиться на позиции дорвея в том же Яндексе наличие на сайте кучи малорелевантных (с точки запросов, под которые сделан дорвей), текстов?

Яндекс, насколько мне известно, не работает пока с темами сайтов, поэтому эта куча страниц либо не отразится никак на результатах поиска, либо в хорошую сторону -- даст посетителей.

С уважением,

Александр Садовский.

Originally posted by Gray:
Вообще-то есть OpenSource-проект для поисковиков - MnoGoSearch .

Есть еще выпускаемый под GNU GPL ASPseek , в нем, кстати, PageRank реализован. Если кого-то вдохновляет OpenSource, прекрасно, начинайте с этих проектов. Через пару лет результаты сравним.

2vs: Влад, думаю, Вы прекрасно понимаете, что искать абсолютную формулу релевантности вовсе не нужно. Достаточно в конкретном случае понять, за счет чего именно обгоняют конкуренты (а речь идет, как правило, о максимум 10-20 сайтах, которые выше в результатах), и скорректировать свою страницу. Даже если она не достигнет экстремума, она окажется на первом месте, а это и есть искомый результат. Так что ждем открытия кода Рамблера, а мы уж отблагодарим.

С уважением,

Александр Садовский.

Originally posted by Gray:
Вообще-то есть OpenSource-проект для поисковиков - MnoGoSearch .

Есть еще выпускаемый под GNU GPL ASPseek , в нем, кстати, PageRank реализован. Если кого-то вдохновляет OpenSource, прекрасно, начинайте с этих проектов. Через пару лет результаты сравним.

2vs: Влад, думаю, Вы прекрасно понимаете, что искать абсолютную формулу релевантности вовсе не нужно. Достаточно в конкретном случае понять, за счет чего именно обгоняют конкуренты (а речь идет, как правило, о максимум 10-20 сайтах, которые выше в результатах), и скорректировать свою страницу. Даже если она не достигнет экстремума, она окажется на первом месте, а это и есть искомый результат. Так что ждем открытия кода Рамблера, а мы уж отблагодарим.

С уважением,

Александр Садовский.

Поскольку и у меня число ссылок стало меньше ровно на 2, можно предположить, что исключили из подсчета два каких-то распространенных каталога или каталог и его зеркало.

С уважением,

Александр Садовский.

Всего: 1503