Будущее поисковых алгоритмов - ваши предположения...

S
На сайте с 20.08.2007
Offline
140
#11

Думаю, чтобы предсказать перспективы развития поисковых машин в России на несколько лет вперед достаточно ознакомиться с текущей ситуацией в данной сфере на Западе. Дорвейщики, успешно работающие под Гуглю и Яху могут про это кое-что рассказать.

logvin
На сайте с 22.02.2006
Offline
33
#12
Дак это называется каталог

Между каталогом сайтов и поисковиком большая разница. В каталоге - поиск по описаниям сайтов, в поисковике - полнотекстовый поиск по html-документам.

каталоги уже вымирают потихоньку

Нормальные каталоги (для людей) никогда не умрут. Например, с 2002 года в Рунете существует каталог медицинских сайтов http://webmed.irkutsk.ru В каталоге только некоммерческие сайты, его создатель - профессор, доктор медицинских наук Фарид Белялов. Чувствуете, какой уровень каталога?

vitali_y
На сайте с 23.05.2007
Offline
33
#13

Согласен со Славой Шевцовым насчит персонификации - нету смысла в этом совершенно никакого.

vitali_y добавил 07.02.2008 в 18:38

роботов-мозгов-клонов анализирующих инфу никаких не будет конечно - в ближайшие лет 100. да и с ними технология поиска останется тойже принципиально что есть и сейчас

vitali_y добавил 07.02.2008 в 18:43

текущие алгоритмы - насколько мне известно в состоянии эффектирно фильтровать/ранжировать инфу. учет ссылок нужен скорее для другой цели чем ранжирование - и при нормальном/идеальном условии (т.е. отсутствии спама в инете) ссылочное ранжирование по сути своей бессмысленно

vitali_y добавил 07.02.2008 в 18:45

google запудрил всем мозг своим pageraNkom - хотя по сути это скорее рекламная фишка аля microsoft

A
На сайте с 10.10.2007
Offline
25
#14
vitali_y:
Согласен со Славой Шевцовым насчит персонификации - нету смысла в этом совершенно никакого.

А я поспорю.

Есть вещи гораздо более очевидные чем вкус и поведение. На простых примерах - если Вы, допустим, территориально в Нижнем Новгороде, очевидно, Вам не нужны ссылки на доставку пиццы в Москве. Если Вы недавно купили авто с бензиновым двигателем, Вам, очевидно, не нужно автомобильное масло для дизеля. Если Вы работаете в банковской сфере, под поиском по слову "банк" Вас будут меньше всего интересовать банки спермы.

Кроме того, что пользователь ленив(хочет поменьше сделать и получше поиметь - поменьше слов в строке запроса и покачественнее ссылки), он еще и неопытен - поиск требует навыков, даже, скажу, "поисковой" интуиции. Мало ли ежедноевно в сети появляется пользователей, которые даже не знают что баннеры, это такая рекламная замануха.

Поэтому поисковиковые системы должны очевидным образом интересовать дополнительные сведения о том, кто ищет.

Начал переводить описание-презентацию Гугла еще 2000 года The Anatomy of a Large-Scale Hypertextual Web Search Engine, с которым Грин и Пейдж начали привлекать инвесторов. И почему-то вот не создается ощущения, что в ней делался акцент на качество поиска только для лоска, чтобы заманить инвесторов. Ключевое слово - релевантость - точность попадания. Пейджранк это просто инструмент для определения релевантности, который был придуман в конкретное время, и, понятное дело, он может со временем чем-то дополняться или быть вытеснен другим инструментом.

Приложить к этому делу, с учетом развития сервисов, приватные и не очень данные - не такая уж непосильная задача.

А про всякие радости лингвистического анализа - это, согласен, далекая тема.

------ это не завуалирование предложение себя в качестве эксперта. это мнение. Поведение в споре должно быть простым: (с) Стили спора (http://www.jvanetsky.ru/data/text/t7/stili_spora/?print=1) М.М.Ж.
[Удален]
#15

Главная тенденция - это борьба с покупкой-продажей ссылок. Сейчас видно, что ПС начали эту борьбу сразу по нескольким направлениям, среди которых

- обнуление PR для продажных морд

- некое подобие песочницы для молодых сайтов и внешних ссылок

- пессимизация за внешние факторы. По крайней мере на форуме много тем типа "накупил много ссылок, сайт просел по всем запросам".

Таким образом, поисковики потихоньку учатся определять естественные и продажные ссылки. Конечно перехитрить некоторых оптимизаторов не получится, но большинсто из них могут просто остаться без работы, когда сапу и ксапу будут просекать. Ну вот представьте, биржи ссылок уже неэффективны, 80% читателей этого форума не знают, как еще продвигать сайт. Таким образом, с усложнением алгоритмов ПС, СЕО превратится в профессию для настоящих профессионалов, которых будет относительно не много.

Как ПС может еще определить продажный сайт? Жил себе сайтик, и на внутренних страницах исходящих ссылок почти не было. А потом вдруг это число начинает неуклонно расти. Подозрительно? Более чем. Бан за внутренние факторы!

Лингвистический анализ осмысленности, полезности и актуальности текста - дело очень-очень далекого будущего.

Персонифицированный поиск - тут много подводных камней. Предположим за домашним компом сижу как правило я сам. А сядет попользоваться гуглом другой человек - и что за бредовые результаты он получит? Да и вообще, персонификация поиска для миллионов (сотен миллионов) человек потребует просто огромнейших ресурсов. Представляете, для каждого пользователя составить персональный "портрет" и регулярно его обновлять? А ведь меня интересуют в интернете сайты очень многих тематик и мою персону не опишешь в двух словах. Будет это не скоро, возможно через десяток лет мы к этому прийдем.

Так что вместо персонифицированного поиска дешевле научить пользователей более конкретно ставить вопросы, чем угадывать, что они имели ввиду, задавая запрос "дизайн".

Слава Шевцов
На сайте с 23.07.2005
Offline
370
#16
amso:
А я поспорю.
Есть вещи гораздо более очевидные чем вкус и поведение. На простых примерах - если Вы, допустим, территориально в Нижнем Новгороде, очевидно, Вам не нужны ссылки на доставку пиццы в Москве. Если Вы недавно купили авто с бензиновым двигателем, Вам, очевидно, не нужно автомобильное масло для дизеля. Если Вы работаете в банковской сфере, под поиском по слову "банк" Вас будут меньше всего интересовать банки спермы.

Для территориального таргетинга персонификация не нужна - есть IP. Про "банк" вообще смешной пример. Специалист в своей области однословник не введёт - он сразу уйдёт в многословные низкочастотники, где толку от персонификации никакой из-за малости стат. данных. Однословники и прочие высокочастотники вводят люди, которые знакомы с темой очень поверхностно. Соответственно, стат. данных по их персональным ожиданиям у поисковика быть вроде как не может.

amso:
И почему-то вот не создается ощущения, что в ней делался акцент на качество поиска только для лоска, чтобы заманить инвесторов. Ключевое слово - релевантость - точность попадания. Пейджранк это просто инструмент для определения релевантности, который был придуман в конкретное время, и, понятное дело, он может со временем чем-то дополняться или быть вытеснен другим инструментом.

Да, именно для этого ПейджРанк и использовался.

amso:
Приложить к этому делу, с учетом развития сервисов, приватные и не очень данные - не такая уж непосильная задача.

Просто для учёта приватных данных нужно нарушить ряд законов о персональных данных. Да и не понятно будет ли в этом толк. Простой вопрос из Вашего примера: пусть я купил машину и ввёл в поисковике "масло". Что мне нужно выдавать?

Неизменность точки зрения неизменно порождает иллюзию понимания.
vitali_y
На сайте с 23.05.2007
Offline
33
#17

>>>

Сообщение от amso

И почему-то вот не создается ощущения, что в ней делался акцент на качество поиска только для лоска, чтобы заманить инвесторов. Ключевое слово - релевантость - точность попадания. Пейджранк это просто инструмент для определения релевантности, который был придуман в конкретное время, и, понятное дело, он может со временем чем-то дополняться или быть вытеснен другим инструментом.

Да, именно для этого ПейджРанк и использовался.

>>>

google Пейджранк - это не инструмент определения релевантности - по крайней мере из того что я про него читал и на что там делается упор. это скорее инструмент - фильт против всякого рода нечестного поднятия в выдаче.

A
На сайте с 10.10.2007
Offline
25
#18
Paragelmen:

Персонифицированный поиск - тут много подводных камней. Предположим за домашним компом сижу как правило я сам. А сядет попользоваться гуглом другой человек - и что за бредовые результаты он получит?

Наверняка Вы видели http://www.google.ru/ig

По Вашему под одним профайлом сидят по нескольку человек?

[Удален]
#19
Paragelmen:

- пессимизация за внешние факторы. По крайней мере на форуме много тем типа "накупил много ссылок, сайт просел по всем запросам".

Плохому танцору Яндекс мешает... Ну чушь же, чушь... Насчёт остального, может, и верно...

По поводу будущего: как раз сегодня прочитал статейку. Может быть, это? По крайней мере, написано неплохо. Мне нравится... Open Source поисковик... :)

A
На сайте с 10.10.2007
Offline
25
#20
Слава Шевцов:
Для территориального таргетинга персонификация не нужна - есть IP.

ip - уже персонификация, в той или иной степени.

Слава Шевцов:
Специалист в своей области однословник не введёт - он сразу уйдёт в многословные низкочастотники, где толку от персонификации никакой из-за малости стат. данных. Однословники и прочие высокочастотники вводят люди, которые знакомы с темой очень поверхностно. Соответственно, стат. данных по их персональным ожиданиям у поисковика быть вроде как не может.

Поправьте, не прав. Слова "низкочастотники" "высокочастотники" мне кажутся придуманными SEO, а не поисковыми сервисами, и, надо полагать, были придуманы как следствие конкуренции за поисковые запросы. Какое дело, собственно, поисковой системе, что у нее топе выдачи, кроме того, чтобы ожидать оправдания того, кто ищет(если опустить моменты типа проплачивания места в топе).

Слава Шевцов:

Просто для учёта приватных данных нужно нарушить ряд законов о персональных данных.

Ерунда. Речь же не о сливе данных третьим лицам.

Слава Шевцов:
Да и не понятно будет ли в этом толк.

Да вот пытаюсь донести, но, видимо, не очень хорошо получается.

Слава Шевцов:
Про "банк" вообще смешной пример.
Слава Шевцов:

Простой вопрос из Вашего примера: пусть я купил машину и ввёл в поисковике "масло". Что мне нужно выдавать?

не масло, а автомобильное масло. Если Вы регистрировали сайт в каталогах, он уже обозначен какой то тематикой. С этим легко можно справится и через морфологию, которая даже в дубовом mnogosearch уже сто лет.

Примеры, сами понимаете, были условными, просто, чтобы было понятно, о чем я.

amso добавил 09.02.2008 в 04:04

vitali_y:
>>>
google Пейджранк - это не инструмент определения релевантности - по крайней мере из того что я про него читал и на что там делается упор. это скорее инструмент - фильт против всякого рода нечестного поднятия в выдаче.

Почти уверен, что Вы не правы. PageRank - инструмент.

А фильтр - это то, что принято называть "костылем"(не обязательно в плохом смысле), чтобы дополнить недостаточность инструмента.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий