Vyacheslav Tikhonov

Рейтинг
130
Регистрация
27.01.2001
Должность
Developer
Интересы
search engines, bots, information retrieval, data mining
Master's Degree in Computer Science
Число сайтов не является показательным. С точки зрения yandex.ua в УАнете примерно 40-50 млнов страниц

Интересно было сравнить с объемом Меты и Бигмира.

Запихнуть на один сервер в принципе можно, но будет тормозить, особенно если индексация тоже на том же сервере вертится :-)

Если на этом сервере будет еще и нагрузка от запросов нескольких тысяч пользователей, то даже теоретически невозможно - памяти не хватит.

есть поле description и title И по ним бы хотелось бы иметь приемлимый поиск, а не просто LIKE из базы

Самый простой способ, который здесь неоднократно обсуждался - создать индекс в отдельной таблице вида

id_слова - id_записи_в_базе .

Дальше с ними работать совсем просто - делаете выборку по слову, получаете список документов и ранжируете документы по плотности ключевых слов.

Что имеется в виду?

Общий объем html (количество сайтов и страниц) и поискового индекса.

Можно, если поднатужиться.

lagif, о каком объеме идет речь?

Ну, говорят, что "Мета" на mysql вся...

lagif, Коваленко не говорите про Мету на mysql. Звучит как анекдот.

Яндекс 59%
Рамблер 20,6%
Гугл 9%

Антон, ты берешь статистику по массовости пользователей, а не по количеству потенциальных покупателей. Понятно, что количество желающих что-либо купить в процентном соотношении примерно одинаково вне зависимости от поисковика, вопрос лишь в том, насколько быстро пользователь получит нужную информацию и примет решение о покупке.

Здесь же я смоделировал ситуацию, когда выдача того же Яндекса или Рамблера настолько не понравится пользователю, что он перейдет на другой поисковик.

интересное наблюдение...

Думаю, что spark прав в том, что виной этому деятельность оптимизаторов, однако тому же Гуглу, как показывает пример, это нисколько не мешает показывать более релевантную выдачу.

Может предпочтительнее смотреть в Маркете

Конечно, однако его посещаемость значительно уступает основному поиску Яндекса, не так ли? :) К тому же, средний пользователь в подавляющем большинстве случаев не различает, где товарный поиск, а где универсальный, рассматривая общую поисковую строку как способ получить любую информацию, в том числе и о доступных товарах.

ну, в яндексе, положим, из 50 всего 6 первых страниц. они твои посты исправляют на лету

Давай оценим первую десятку Яндекса, руководствуясь представлениями о релевантности среднего пользователя, задающего данный запрос - видеокамеры jvc.

Ожидания пользователя - получить статьи и страницы интернет-магазинов с

каталогом(!), то есть списком различных видеокамер JVC.

Что мы видим в итоге:

1. Videomag.ru - цифровые видеокамеры Sony, цифровые видеокамеры Panasonic ...

www.videomag.ru

Ссылка не в дугу - теряем время на навигации на сайте, так как попадаем на первую страницу.

2. Видеокамера JVC GR-FX 120. TeleAudio.ru - видеокамера JVC GR-FX 120.

www.teleaudio.ru/catalog19/descr1230.htm

Внутренняя страница, но не та - я просил Каталог с видеокамерами, а не конкретную.

3.Видеокамера JVC GR-DX27E. Цены на JVC GR-DX27E, описание, характеристики.

www.avmag.ru/catalog41/models11/descr8103.htm

Аналогично - лишние клики со стороны пользователя, который хочет просмотреть именно каталог камер.

4. Цифровые видеокамеры JVC

www.torgtehnica.ru/catalog/?lang=rus&c_id=117

О, это оно! Но только на 4-м месте. :(

Оцениваем выдачу и далее по этому критерию - в десятке только 5 из 10 релевантных страниц, причем первая из них только на 4-м месте. Смотрим Google - там 10 из 10.

Если пользователь желает просмотреть цены в различных интернет-магазинах и что-то выбрать, то искать в Google значительно предпочтительнее.

Подводя итоги, можно сказать, что Яндекс не различает информационную, транзакционную и навигационную составляющую запроса, в то время как Google это делать умеет, возможно, в большей степени благодаря отсутствию морфологии.

низко же ты ценишь релевантность яндекса

Насколько ты помнишь, фича с флажками поиска в регионе появилась совсем недавно.

как я понимаю, ты рассматриваешь ситуацию, когда с яндекса много кликов "мимо кассы"

Точно! Мне, например, не нравится, что в Яндексе часто первая страница имеет больший вес, чем страница с товаром. Например, по запросу видеокамеры JVC в Яндексе идут не внутренние страницы сайтов, а стартовые, поэтому приходится проделывать дополнительный путь по сайту, чтобы найти нужную страницу. Google же выдает по этому же запросу только нужные страницы, поэтому пользователь вполне доволен тем, что может себе без лишних движений выбрать себе нужную видеокамеру.

Антон, в твоем докладе есть одна вещь, которую ты не учел - это наличие таргетинга в поисковике для откровенно коммерческих запросов.

Например, если находящийся в Киеве человек хочет сделать некую покупку и ищет товар через Яндекс, однако в основной выдаче видит исключительно российские сайты (или наоборот), он откроет пару линков, развернется и уйдет на более дружелюбный поисковик вроде Google, учитывающий тип запроса и региональную специфику.

То есть для пользователя выдача Яндекса будет нерелевантной, но его клики, отображаемые в статистике сайта, могут создать иллюзию, что количество покупателей из Рамблера или Google больше.

Присоединился! Володя, поздравляю!

Всего: 847