funsad

digits.ru

Рейтинг

116

Регистрация

15.11.2000

5 января 2001, 21:04

Originally posted by Pumba:
1)Все время в Рамблеровской статтистике у меня числятся некие "подозрительные" страницы, или посещения...Из-за чего это происходит, как с этим бороться и надо ли вообще и чем мне это грозит?

http://www.rambler.ru/doc/faq.shtml#16

2)Если весь сайт (в основном) представляет собой один большой cgi-скрипт (сайт поисковик) - то счетчик Рамблера как размещать? на каждой странице или ТОЛЬКО на первой?

См. http://top100.rambler.ru/top100/rules.shtml.ru -- при регистрации нужно указать, что это cgi-скрипт, при этом размещать, как обычно -- только на первой странице.

Подарок от господина Рамблера?

5 января 2001, 10:13

Originally posted by Ashmanov:
Очевидно, тестировался старый поисковик Рамблера, поскольку в новом сайты пронумерованы.

Приношу Рамблеру и участникам форума свои извинения за преждевременную дезинформацию. Я действительно перешел по ссылке, но воспринял приведенный там текст как информацию о том, что движок Рамблера сменился. И, соответственно, тестировал, зайдя с главной страницы.

Та же история - новый Рамблер на самом деле не находит лекарственных средств на первой странце вообще, а только сайты, "косвенно" относящиеся к Харькову.

Итак, первые впечатления, дубль два:

1. Обилие информации в результатах поиска, часть из которой является если не лишней, то не самой важной. Над usability, мне кажется, стоит еще поработать.

1.1. Я придерживаюсь высказанного мной ранее мнения, что ссылка "далее" в списке страниц внизу должна перекидывать на следующую страницу, а не на следующий десяток страниц. Наличие ссылки "следующие 15" в начале текста не оправдание, т.к. переход на следующую страницу, как правило, осуществляется после просмотра всех ссылок, то есть когда взгляд упирается в конец страницы, а не в начало. Целиться же мышкой в крохотную циферку в списке страниц быстро надоедает.

2. Теперь про дубли:

А дубли в результатах поиска - дело обычное, например, в Яндексе их в несколько раз больше, что является его известной болезнью и что легко проверить.

Возможно, это так, дубли -- общая проблема. Но ни в Апорте, ни в Яндексе я не встречал двух версий одного документа с идентичным URL. Именно это удивило меня больше всего.

Даже если проигнорировать обычные дубли (совпадение текста), то проблема зеркал и идентичных URL в Яндексе неплохо решена. Может это было только в старом Рамблере? Увы, нет. Новая версия Рамблера, поиск по слову "Садовский": документ 11 совпадает с документом 23 не только по содержанию, но и по всем URL.

3. Как и в Яндексе, не полностью решена проблема идентификации сайтов, не имеющих доменного имени. В частности, в результатах поиска нетрудно заметить, что отдельный сайт http://exler.ru/anton/ считается разделом сайта http://exler.ru/ .

4. Релевантность действительно значительно выше старого Рамблера, поэтому мое заявление насчет использования только Яндекса с Апортом можно относить лишь к старому Рамблеру. В то же время, простор для улучшения есть. Если, например, по запросу

"Санта Клаус" "Дед Мороз"

только первый документ не содержит ни одного из этих слов и называется "Офисный портал: канцтовары, бумага, офисные принадлежности и полиграфия", а почти все остальные ссылки релевантны, то по запросу

Эйнштейн "формула успеха"

я не встретил ни одного релевантного документа среди первых 30. Для сравнения, у Яндекса все три документа со строгим соответствием полностью релевантны, у Апорта -- 3 из первых 10 релевантны.

5. Что касается языка запросов,

Я уже писал, что язык запросов "умощнять" мы и не будем. Я считаю, что "мощный" язык запросов - признак слабости системы, а развивать поисковик нужно в сторону запроса на естественном языке.

Игорь, я с Вами полностью согласен в теории. Я с Вами согласен и в том, что среднестатистическому пользователю ориентация поисковика на запрос на естественном языке принесет большую выгоду, чем уклон в сторону усиления языка запросов. Но на практике существует прослойка пользователей, которые, как правило, четко представляют что им нужно и как это искать. Именно для них предназначен язык запросов.

Я знаю достоверно, что если документ есть в базе Яндекса, я его найду; если документ есть в базе Апорта, я найду его с большой вероятностью; с Рамблером часто остается полагаться на случай.

Пример (возможно, не самый удачный, но все же иллюстрирующий мои слова): мне надо было найти информацию о трех самых больших в мире площадях. Первый пришедший в голову запрос для Яндекса

площадь & (("по величине" | "по размеру") /3 "в мире")

выдал примерно 30% релевантных документов. В то же время, среди документов, выданных новым Рамблером на первый пришедший в голову запрос

площадь & ("в мире по величине" | "в мире по размеру")

я не нашел ни одного релевантного среди первых 30.

А вообще нужно иметь в виду, что выставленный поиск - ПРОМЕЖУТОЧНАЯ бета-версия (к слову о тестировании), к которой ещё не подключён новый индекс с координатами слов.

С нетерпением жду этого события.

Спасибо большое за комментарии "из первых уст" к нашим предположениям и впечатлениям.

С уважением,

Александр Садовский.

[This message has been edited by funsad (edited 05-01-2001).]

Интересно, куда все делись?

5 января 2001, 05:32

Originally posted by spider:
Эка ты загнул (я про аналогичные IBM исследования интернета) - не каждый себе это может позволить. Если ты хорошо помнишь эту статью - то наверняка обратил внимание какой комп они использовали для обсчета графа.

"Compaq AlphaServer system containing 16 gigabytes of RAM".

Дело не в компьютере, я не думаю, что в ближайшее время кто-то повторит подобное исследование. (Хотя многие другие полезные исследования сделать не так уж сложно.) Скорее речь о том, что на форуме, посвященном поисковикам, участники должны знать подобные вещи. Уверен, что это не совсем так. Почему? Далеко не у всех есть время для постоянного изучения новостей из мира поисковиков; не у всех достаточно знания английского; далеко не у каждого хватает математической подготовки, чтобы интерпретировать результаты сложных экспериментов. Именно подобные задачи, на мой взгляд, и должен решать сайт о поисковых системах и данный форум.

Кстати, а зачем тебе код поисковиков ? Вот мне, например, информации и так выше крыши (Ну это я так - из любопытства спросил)

Меня интересует не сам код, а алгоритмы (псевдокод). Это хороший способ понять, как теория воплощается на практике -- существует огромное число прекрасных алгоритмов, которые на практике сталкиваются с ограничениями по памяти, быстродействию и, после адаптации, лишь отчасти напоминают первоначальный вариант.

Методология эффективного поиска - гм... опять же это у меня есть для забугорных поисковиков, только опять же не бесплатно

А что сюда входит? Все равно подробное оглавление и "пробные" куски лекций, как правило, предоставляются бесплатно.

С уважением,

Александр Садовский.

Интересно, куда все делись?

4 января 2001, 15:04

Originally posted by Gray:
Народ, я, конечно, понимаю, что праздники и все такое... Но, все-таки...
На форуме зарегистрировано 82 участника. Из них примерно 60 человек я не видел на форуме уже очень давно.

26% активных участников -- это хороший результат. Как правило, эта цифра не превышает 10%, а число сверхактивных обычно около 1-5% от общего числа участников (форума, общества и т.д.).

Неужто неинтересно? Или чего-то не хватает? Так высказывайтесь, говорите, что надо. Добавлю

Мне лично не хватает:

1) ссылок на интересные исследования либо перевода соответствующих статей. Примерами таких исследований я считаю исследование Лоуренса и Гиля, касающееся объема Web; исследование IBM, Compaq и AltaVista о связанности веб-страниц; исследование диаметра Web и пр.

2) исследований русскоязычной части интернета -- поисковиков, web-а и, в меньшей мере, пользователей;

3) инсайдерской и недокументированной информации о поисковиках. Например, кое-какие моменты, не отраженные в разделе "Помощи", я был вынужден выяснять экспериментами: вот мой вопрос http://forum.yandex.ru/?id_note_forum=15256&by_count_days=10&cur_page=1&by_count_page=75&thread=all и более точный ответ Ильи Сегаловича http://forum.yandex.ru/?id_note_forum=15271&by_count_days=10&cur_page=1&by_count_page=75&thread=all

4) развлекательной информации, касающейся поисковиков. Это что-то вроде игр, предложенных Лейбовым;

5) всевозможной статистики, касающейся поиска информации в целом, запросов, поведения пользователей, содержания сайтов и пр.;

6) теоретической информации о реализации поисковиков, примеры реализаций с открытым кодом, обсуждение этих тем;

7) обсуждения методологии эффективного поиска;

и т.д. Я могу перечислять очень много, но и вышеуказанное, мне кажется, реализовать непросто.

С уважением,

Александр Садовский.

Подарок от господина Рамблера?

4 января 2001, 01:35

Originally posted by Gray:
Рамблер выкатил и предлагает протестировать новую версию поисковика. Видимо, это то, о чем нам говорил в ноябре месяце Игорь Ашманов. Первый поиск по новой версии показал, что результаты выводятся гораздо более упорядоченно, но вот релевантность оценить просто не успел.

Первые впечатления:

1. До сих пор нет нумерации сайтов в результатах поиска: при открытии нескольких окон с результатами в середине страницы легко "потеряться" (забыть, смотрел это или еще нет).

2. Надпись "След." в списке страниц внизу вместо ожидаемой, как в других поисковиках, следующей страницы (т.е. 2-й страницы, когда я нахожусь на первой) перебрасывает на 11-ю. Бардак.

3. По поводу "улучшенного качества поиска": по запросу "Харьков" выводятся 4 ссылки, косвенно относящиеся к Харькову, все остальное вообще не имеет отношения к

городу, причем из 15 первых ссылок 10 относятся к лекарственным препаратам.

Аналогично, по запросу "Садовский" выводятся несколько ссылок, даже не содержащих эту фамилию (например, страница газеты Утро); показывается пара ссылок на мои рассказы на других сайтах, ссылок на мой сайт среди первых 45 документов нет, хотя слово Садовский встречается там неоднократно.

4. Разочарование от "улучшенной функции поиска похожих документов" наступает, если взглянуть на документы 29 и 31 при поиске по слову "Садовский" -- и то, и другое ОДИН И ТОТ ЖЕ URL ( http://exler.ru/ezhe/13-06-99.htm ). Конечно, отличить их невероятно сложно. Да вообще странно, как может находится в базе один и тот же документ, проиндексированный дважды -- 28.04.2000 (первый) и 26.11.2000 (второй).

5. Язык запросов не стал мощнее, то есть мало-мальски серьезный поиск вести Рамблером, как и раньше, затруднительно -- по-прежнему отсутствует даже поиск фразы (цитаты).

Резюме: основной поиск, в первую очередь, я по-прежнему буду проводить с помощью Яндекса и Апорта.

С уважением,

Садовский Александр.

Отдача от поисковиков

26 декабря 2000, 04:28

Originally posted by AiK:
Вот это и вызывает некоторые сомнения. По индивидуальной статистике отдача от Рамблера выше, чем от Аппорта, а по общей - наоборот.

Тут, мне кажется, нужно смотреть по типам ресурсов, т.к. от этого зависит число страниц на сайте, их популярность (LP), редкое или частое включение ключевых слов и т.д. Следовательно, может оказаться, что некоторые типы ресурсов настолько "подходят" Апорту, что вытягивают его в общей статистике на второе место.

Отдача от поисковиков

26 декабря 2000, 04:24

Originally posted by AiK:
Блин, до меня только что дошло, что эти цифры (особенно обобщённые) всего навсего отображают популярность поисковиков в рунете

Не совсем так:

=== Cut ===

41. График спайлога про поисковые системы означает не их популярность, а всего лишь то, насколько часто пользователи переходят с поиска на страницы сайтов со счетчиком. Скорее всего, это интегральная оценка популярности и качества, т.к. по нерелевантным ссылкам будет переходить минимум пользователей.

=== Cut ===

Отдача от поисковиков

25 декабря 2000, 17:14

Originally posted by AiK:
Хочется сравнить отдачу от поисковиков.
Я "снял" со спайлога такую статистику:
Апорт 11
Рамблер 71
Яндекс 126

Сайт просуществовал чуть больше года ни под одну из машин не оптимизировался. (Кстати от Яху было 47 посетителей).

Сайт больше года, также не оптимизировался, но SpyLog стоит у меня с 16.09.2000, т.е. 3 месяца с хвостиком. Вот что он говорит:

Яndex 208 41.03%

Rambler 154 30.37%

АПОРТ 120 23.67%

Google Search 16 3.16%

MSN.com 3 0.59%

AOL Search 3 0.59%

Yahoo! 1 0.20%

Excite 1 0.20%

Dogpile Search 1 0.20%

TopList выдает подобную статистику кривовато, но вот она за 380 дней:

Aport - 0,9% посещений в день

Yandex - 0,6%

Rambler - 0,5%

Вот статистика SpyLog по всем сайтам, участвующим в данной системе (цифра означает средний % посещения с поисковика за период с 17 сентября по 17 декабря):

Яndex 39.17

АПОРТ 19.57

Rambler 17.31

Alta Vista 6.828

Yahoo! 5.752

Google Search 4.838

MSN.com 2.029

За период с 27 марта по 17 декабря:

Яndex 31.32

АПОРТ 23.44

Rambler 18.06

Alta Vista 11.26

Yahoo! 5.567

Google Search 4.249

MSN.com 1.549

Как видно, все это индивидуально.

Проверка Яндекса цитирования

22 декабря 2000, 09:53

Originally posted by AiK:
Что-то запутал ты меня братец Кролик со своими диезами

О великий синтаксис языка запросов Яндекса! Не будь тебя, как бы впал я в отчаянье? Этот синтаксис в классическом варианте подразумевает исключительно форму

#link="sitename.ru"

Но на практике, если не комбинировать link с другими операторами, можно опускать и диез, и кавычки и извращать оператор десятками способов. Большая часть извращений работает нормально.

А речь пойдёт о следущем:
теперь проверять CY можно вообще не отходя от кассы - прямиком из IE. Линк тот же.

А зачем его так часто проверять? Раз в неделю вполне достаточно, чаще нет смысла. Если тебя интересует не число ссылок, а сами ссылки, их ты можешь легко получать без дополнительных усилий двумя способами:

а) подписавшись на запросы;

б) изучая логи или статистику счетчика по ссылкам.

Если тебя интересует изменение числа ссылок, то тут снова годятся запросы, а также любые виды отслеживалок.

Проверка Яндекса цитирования

22 декабря 2000, 05:25

Originally posted by Gray:
Хм, все бы хорошо, но Яндекс выдает 19 серверов с ссылками на форум, и среди них нет ни одного бесплатного.

Во-первых, у меня вышло 14 серверов и 468 страниц. Я задавал запрос, как рекомендуется Яндексом, через форму расширенного поиска, исключив ссылки с форума на себя.

Вот эти 14 ссылок:

1. http://www.besplatno.ru/forum/Forum2/HTML/000151.html

2. http://askme.webclub.ru/cgi-bin/forum.cgi?action=thread&id=97

3. http://net.technic.ru/print.php3?sid=53

4. http://hisnameis.narod.ru/p_98.htm

5. http://www.x-time.ru/cgi-bin/cataloglist.cgi?c=12&a=0&i=2&r=207

6. http://www.hi.ru/g.asp?id=506&id1=5&id2=&id3=&id4=&nn=100

7. http://www.microsoft.windows.ce.ru/cat/777/0060.html

8. http://lbe.ru/sites.html?group=00000010

9. http://www.submitter.ru/sites/ru/2/

10. http://hi.ru/g.asp?id=506&id1=5&id2=&id3=&id4=&nn=100

11. http://www.hellzone.spb.ru/hellforum/showthread.php?postid=141

12. http://www.elvesta.kiev.ua/cgi-bin/v_list2.cgi?kat0=1003&page=22

13. http://www.ce.ru/cat/000/10510.html

14. http://www.coollinks.ru/links.htm

Итак, видно, что ссылка под номером 5 находится на бесплатном хостинге narod.ru. Далее, ссылки 6 и 10 идентичны, отличаются только именем домена. Ссылки под номерами 7 и 13 соответствуют одному каталогу (сайту), и потому тоже могут считаться идентичными. Уже остается 11 ссылок из 14.

Ссылка 1 может быть воспринята как ссылка со своего сайта besplatno.ru на его же раздел besplatno.ru/se/. "Осталось" 10 ссылок. Если

теперь приравнять к "бесплатной" любую категорию сайтов, где поместить ссылку крайне легко (форумы, гостевые, каталоги и пр.), то количество ссылок на данный форум становится меньше 10.

Более точно логику CY смогут объяснить только сотрудники Яндекса.

1 ... 139 140 141 142 143 144 145 146 147 ...151

Всего: 1502

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ

Google: E-E-A-T не является фактором ранжирования

funsad