Есть ли толковые работы по поисковым системам?

I
На сайте с 27.04.2004
Offline
18
2775

Добрый день. Был бы признателен тем, кто указал бы на толковые работы (достойные хотя бы университетского диплома) по поисковым системам по направлениям:

1. Поисковик, как динамическая система (с неопределенными динамическими свойствами - "черный ящик со входом и выходом"). Методы исследования и идентификации поисковика ("черного ящика").

2. Практический анализ поисковых навыков пользователей поисковых систем, их активность и поведение (перехода на, повторы, уточнения, удовлетворенность). Лексика запросов, адекватность целям поиска , частотность и т.п.

3. Динамическое управление контентом системы сайтов для решения целевой задачи (напр. максимизация продаж, рост рейтинга раскручиваемого бренда, околпачивание избирателей, максимизация щелчков, минимизация времени распространения целевой информации и т.п.).

4. Супербольшие сайты, их особенности с точки зрения поисковиков (например, как выбирать какие страницы разрешать индексировать, какие нет - все равно все не проиндексируют).

В свое время пробовал найти, но натыкался только тех, кто "на пальцы" и "радиолюбителей". Заранее спасибо.

Мне нужны новые горы Любовь превыше всего (http://love.minich.ru/s-isaac-newton-optics.htm) ## Человеческое (http://www.minich.ru/photo-album/igor-kozlov/index.htm) ## Девушкам отдела канцтоваров Библио Глобуса к 8 Марта :) (http://www.minich.ru/a/index.htm) ### Агентства недвижимости городов Московской области (http://an.minich.ru)
R
На сайте с 12.08.2003
Offline
30
#1

Добрый день.

Мне кажется в России сейчас не проводятся такие исследования, так как они стоят много денег. В США вроде проводятся.

Вот две ссылки которые нашел

http://home.earthlink.net/~searchworkshop/

http://www.nngroup.com/reports/

С уважением, Григорий Рубцов, Онлайн-курс оптимизации сайта (http://tandem-online.ru/seminars/info/seminar748.html)
VT
На сайте с 27.01.2001
Offline
130
#2
1. Поисковик, как динамическая система (с неопределенными динамическими свойствами - "черный ящик со входом и выходом"). Методы исследования и идентификации поисковика ("черного ящика").

Evaluation of Document Retrieval Systems

2. Практический анализ поисковых навыков пользователей поисковых систем, их активность и поведение (перехода на, повторы, уточнения, удовлетворенность). Лексика запросов, адекватность целям поиска , частотность и т.п.

Real life information retrieval: a study of user queries on the Web

Patterns of Search: Analyzing and Modeling Web Query Refinement

4. Супербольшие сайты, их особенности с точки зрения поисковиков (например, как выбирать какие страницы разрешать индексировать, какие нет - все равно все не проиндексируют).

Crawler-Friendly Web Servers

I
На сайте с 27.04.2004
Offline
18
#3

Спасибо за информацию. Правда хотелось бы найти информацию (как сказал бы химик) не по качественному анализу, а по количественному. То что нельзя выразить числом на самом деле (как правило) бесполезно, за исключением великих идей, но в данном случае меня интересуют практические аспекты.

Набираем в Яндексе пробный запрос (напр. 2 слова) получаем 100 первых страниц, текст которых известен, анализируем и делаем предсказания как будут ранжированы какие - либо существующие страницы Яндексом. Если предсказания удовлетворительные - честь нам и хвала, иначе входим в режим последовательных приближений. Просто немного смешно читать темы по "черному вторнику". Поднялся-опустился, вроде бы так, вроде бы этак, вместо того чтобы сделать эксперимент и довести до числа. Сам бы давно сделал бы, да времени нет - это же не моя профессия.

В первом приближении-линеаризованная модель, подсчитать корреляционные функции по положению этих двух слов в разных тегах, абзацах, ссылающихся страницах и т.п., ортогонализовать по признакам, а потом применять к своим разрабатываемым страницам. Неужели на этом уровне никто не работает?

VT
На сайте с 27.01.2001
Offline
130
#4
В первом приближении-линеаризованная модель, подсчитать корреляционные функции по положению этих двух слов в разных тегах, абзацах, ссылающихся страницах и т.п., ортогонализовать по признакам, а потом применять к своим разрабатываемым страницам. Неужели на этом уровне никто не работает?

Вряд ли кто-то это делает - для подобных вещей нужно быть самому достаточно серьезным разработчиком. Поэтому работа оптимизатора где-то и похожа на шаманство - может быть, что-то получится, а может и нет.

K
На сайте с 31.01.2001
Offline
737
#5
Набираем в Яндексе пробный запрос (напр. 2 слова) получаем 100 первых страниц, текст которых известен, анализируем и делаем предсказания как будут ранжированы какие - либо существующие страницы Яндексом.

Не вижу смысла. Вы ведь в курсе, что очень сильно влияют внешние факторы. Как их анализировать? А если не все ссылки учитываются?

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
[Удален]
#6
В первом приближении-линеаризованная модель, подсчитать корреляционные функции по положению этих двух слов в разных тегах, абзацах, ссылающихся страницах и т.п., ортогонализовать по признакам, а потом применять к своим разрабатываемым страницам. Неужели на этом уровне никто не работает?

По-моему этим многие страдают на каком-то этапе. Ну как вечный двигатель изобретать, или там камень философский. :)

Rev
На сайте с 18.10.2003
Offline
151
Rev
#7

ikozlov, Вы считаете алхимию наукой?

Вот так и с поисковой оптимизацией...

Есть один информационный ресурс. Содержание - тексты самой разнообразной тематики. Рука оптимизатора этого сайта не касалась. Эдакий экологический заповедник в сети. :)

Так вот.., сразу после "черного вторника" количество посетителей с Яндекса составляло 50% от количества посетителей с Рамблера. Сейчас все поменялось местами. Яндекс теперь как и до "вторника" дает посетителей в два раза больше чем Рамблер. Количество посетителей с Рамблера последние 2-3 месяца практически не менялось.

Сам ресурс существует более трех лет. Никаких резких изменений на нем не производилось ни до "вторника", ни после...

Вот я Вас и спрашиваю:

1. Какие выводы из этого можно сделать?

2. Как можно изучать абсолютно непредсказуемую систему?

3. Какой в этом смысл? Ведь, завтра все может измениться кардинально, причем в разы!

Оптимизма нет! (http://www.optimisma.net.ru/)
I
На сайте с 27.04.2004
Offline
18
#8

Спасибо, ребята за интерес к теме.

Основная составляющая моего интереса - получить практические результаты. Кое-что мы сделали на www.regprom.ru, www.gazresurs.ru и т.д. (пока я там работал), не сумел пробить соответствующую работу в www.biblio-globus.ru (когда заведовал интернет-магазином), намечаю кое-что сделать на своем сайте www.minich.ru и в других задуманных проектах.

Могу привести примеры, когда совершенно неправильные представления об явлении давали прекрасные результаты путем системного подхода.

1. Теория Птолемея в астрономии (до Коперника) давала прекрасные предсказания о движении планет, правда ко времени Коперника пришлось увеличить число вращающихся сфер (вокруг Земли!!!) до 24 (т.е где-то 100 параметров движения).

2. "Волны Эллиота" перевернули подход к финансовым операциям и сейчас, например, "Форекс" не обходится без анализа процессов в дробных размерностях...

3. Этим примерам числа нет...

Чем хуже и сложнее положение с поисковиками?

Вы правы - поисковики не являются статичными системами, задача стоит чуть сложнее - как быстрее к ним подстроиться, когда они "апдейтят" ? :-)

Внешние факторы? А где их нет? Существует не одна красивая теория оптимизации динамических систем при наличии недетерминированных внешних воздействий ("шума"). Летают же ракеты и самолеты в автопилоте даже в грозу, да и телевизоры работают в условиях помех (фильтры стоят).

Просто я хотел знать, доросла ли деятельность оптимизаторов до серьезного ПРОФЕССИОНАЛЬНОГО уровня или пока еще переживает "младенческий" период. Пока похоже на последнее. Для меня это плохо - я хотел воспользоваться результатами науки для "инженерных" приложений. А для молодежи - хорошо: непаханое поле для кандидатских и докторских и стартовое поле для прорыва в академики соответствующих наук.

Удержание в "секрете" своих успехов обычно указывает на "алхимичный" период созревания соответствующей отрасли знаний, а серьезным людям (потенциальным инвесторам) дает намек на существование большого количества "пройдох" и "шарлатанов", знающих секреты получения золота из глины. А это плохо для нас всех, кто намерен зарабатывать свои кровные честно, а не путем обмана. С чем я Вас всех и поздравляю!

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий