Поисковые системы и потоп данных

B
На сайте с 15.01.2014
Offline
43
429

Скопирую пост со своего блога, чтобы модераторы меня опять не обвинили в рекламе блога.

"Первая поисковая интернет-система появилась в 1989 году. С тех пор размеры информации в интернете выросли в тысячи раз, но интерфейс поисковых систем остался прежним - это обычная поисковая строка. Одно сформулированое предложение для поиска, по которому вам предложат результаты.

Стремление поисковых систем научится понимать пользователя всего по одной строке текста логично. В конце концов известна конечная точка развития таких систем - это естественный язык в поисковом запросе. Но даже если бы искуственный интеллект уже был изобретен и применен в поисковвых системах, всегда ли можно обьяснить и сформулировать то что ищешь всего одной строкой ?

Для начала давайте обратимся к статистике и математике. При существующих обьемах информации, 99,9% сайтов никогда не увидят топ. Причем на этих сайтах будет качественый контент, контект который ищет пользователь. Но из-за того что под простой поисковый запрос пользователя подходят изначально тысячи сайтов в интернете, в топе будет только то, что посчитает нужным показать поисковая система. Все остальное будет отсеяно.

Итого мы получаем достаточно сложную ситуацию. С одной стороны у нас есть примитивная поисковая строка. А с другой стороны океан информации. Причем с точки зрения запросов к базе данных, чем больше информации, тем более жесткий фильтр должен быть, чтобы более тонко отфильтровать результаты.

Как найти в интернете все сайты, например с таким фильтром:

"Какие отели есть в пределах 100 км от моего дома. Область поиска за городом. В отеле есть бильярд и настольный теннис. Сайт отеля имеет систему онлайн букинга".

Здесь уже не обходится дело одной поисковой строкой. Нужно поставить некоторое короткое техническое задание поисковой системе."

Что вы думаете по этому поводу ?

---------- Добавлено 11.11.2014 в 14:55 ----------

Я сейчас как раз пытаюсь разобраться в сути вещей.

Сделать, так сказать прыжок, примерно как Джобс перепрыгнул с кнопочных телефонов на айфоны.

Ввести другую концепцию.

www.booben.com (www.booben.com) - ассоциативный поисковый движок Блог (blog.pikosec.com) - как создавался поисковый движок с нуля Альбом (http://booben.com/Query?q2=CustomPhrase%2Bssearch%20%40today%20%40img%2B1&s=online&a=search&p=1) картинок searchengines.guru за сегодня
topy
На сайте с 28.03.2006
Offline
142
#1
Bazist:
Здесь уже не обходится дело одной поисковой строкой. Нужно поставить некоторое короткое техническое задание поисковой системе.

По такому принципу работает, например, Я.Маркет - строгое соответствие параметрам. Ищет не сайты, конечно, а товары, но тем не менее... Пользователю все равно проще набрать (а теперь уже и просто сказать) искомое, а поисковик, опираясь на интересы пользователя и его потенциальные предпочтения построит выдачу.

Новости коротко и ясно (https://subnews.ru)
B
На сайте с 15.01.2014
Offline
43
#2
topy:
По такому принципу работает, например, Я.Маркет - строгое соответствие параметрам. Ищет не сайты, конечно, а товары, но тем не менее... Пользователю все равно проще набрать (а теперь уже и просто сказать) искомое, а поисковик, опираясь на интересы пользователя и его потенциальные предпочтения построит выдачу.

Поиск по параметрам, самая простая и очевидная область.

Тут вопрос больше в другом. Если ли смысл усложнить поисковый фильтр для глобального поиска.

Не будет ли пользователь лениться его устанавливать ?

Ведь он привык к простой поисковой и малофункциональной строке.

topy
На сайте с 28.03.2006
Offline
142
#3
Bazist:
Не будет ли пользователь лениться его устанавливать ?

Я о том и говорю, что сейчас уже устно можно задать поисковый запрос и пользователь пойдет по пути наименьшего сопротивления. Пусть даже потом придется перелопатить тонны сайтов и трижды скорректировать свои запрос.

Естественно ИМХО

B
На сайте с 15.01.2014
Offline
43
#4
topy:
Я о том и говорю, что сейчас уже устно можно задать поисковый запрос и пользователь пойдет по пути наименьшего сопротивления. Пусть даже потом придется перелопатить тонны сайтов и трижды скорректировать свои запрос.
Естественно ИМХО

Проблема в том что 99% сайтов с хорошим контентом никогда не увидят топ.

Потому что как не лопать запрос, на первую страницу уже есть 100500 кое-каких претендентов.

Kait
На сайте с 28.02.2012
Offline
37
#5

Мне, как пользователю, совершенно нас рать, что 99% сайтов не увидят топ. А также пофиг на их "прекрасный" контент. Могут им подтереться.

B
На сайте с 15.01.2014
Offline
43
#6
Kait:
Мне, как пользователю, совершенно нас рать, что 99% сайтов не увидят топ. А также пофиг на их "прекрасный" контент. Могут им подтереться.

Ну вот взять гипотетический случай. У вас на аватарке ежик ест яблоки. Допустим в мире есть 10 ученных со своими блогами которые изучают процесс поедания ежиками яблок. Но как найти эти 10 сайтов ? Их найти нереально. Потому что про ежики и яблоки есть уже 100500 сайтов которые забили топ до десятой страницы. У вас нет возможности более тонко настроить поиск, чтобы из миллиардов страниц вернуть те что надо.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий