Недостатки Рамблера, Яндекса и др.

12
P
На сайте с 07.01.2004
Offline
3
3047

Разрешите поднять одну из наиболее важных тем о недостатках современных поисковых систем. Цель: подтолкнуть разработчиков к новым идеям и действиям. (Ошибки и ручные переработки не считаются. Только глобальные вещи.) Итак:

1.Каталогизация (как бы это без нее индексировать все подряд?) медленно работает.

2.Медленная индексация из-за большого объема (реагирвание на изменения на странацах).

3.Не понимание грамматкики (Увы, только рядом стоящие слова считаются словосочетаниями).

4.Никакого поиска картинок и музыки (имен файлов не считаются).

С уважением,

Павел.

А
На сайте с 14.11.2003
Offline
150
#1
Как писал Pavelkq
Цель: подтолкнуть разработчиков к новым идеям и действиям.

Боюсь, не достучимся.

1.Каталогизация... медленно работает.

Что вы имели ввиду?

2.Медленная индексация из-за большого объема...

Тут остается один совет - наращивать мощности за счет привлечения спонсоров. Но там (Rambler, Yandex и др.) тоже не дураки сидят.

3.Не понимание грамматики (Увы, только рядом стоящие слова считаются словосочетаниями).

Допустим, тот же Yandex прекрасно понимает морфологию. И со словосочетаниями прекрасно справляется. Помните, что хоть и посковые системы пишут люди, ищут все-таки роботы.

4.Никакого поиска картинок и музыки (имен файлов не считаются).

Ну сами подумайте, по каким критериям можно искать картинки и музыку? Неужели вы думаете, что поисковый робот сможет определить, что нарисовано на картинке, или взять и запросто послушать музыку? А потом все это занести в поисковую систему.

А так... неплохой поиск по тем же картинкам есть и в Yandex'е, и в Aport'е, и в Google'е.

A
На сайте с 21.12.2003
Offline
15
#2
Как писал Анар
Ну сами подумайте, по каким критериям можно искать картинки и музыку? Неужели вы думаете, что поисковый робот сможет определить, что нарисовано на картинке, или взять и запросто послушать музыку? А потом все это занести в поисковую систему.
А так... неплохой поиск по тем же картинкам есть и в Yandex'е, и в Aport'е, и в Google'е.

картинки можно искать по альтам, имени файла и прилежащему тексту,

а для поиска музыки можно юзать id3tag, наскока я понимаю.

А
На сайте с 14.11.2003
Offline
150
#3
Как писал apfox


картинки можно искать по альтам, имени файла и прилежащему тексту,
а для поиска музыки можно юзать id3tag, наскока я понимаю.

Я знаю эти вещи. Думаю, что Pavelkq тоже знает. Он, наверное, имел ввиду другие алгоритмы поиска музыки и картинок. Я ему ответил, что пока такое невозможно.

A
На сайте с 08.03.2003
Offline
203
#4

Pavelkq, сделай свою поисковую систему ;)

Славгородский Алексей,
Ваш Партнер – создание и продвижение сайтов (http://vashpartner.ru/)
P
На сайте с 07.01.2004
Offline
3
#5
Как писал Аleks
Pavelkq, сделай свою поисковую систему ;)

Я этим и планирую заняться:-) Анар, я вовсе не ругаю поисковые системы. Просто, легче учиться на ошибках других. Вот и устроил опрос с целью подытожить недостатки. (О достоинствах прекрасно говорится на самих сайтах разработчиков). А поиск картинок и музыки я действительно представляю, как интеллектуальную систему. В часности, есть программа DPEG, позволяющая производить поиск дубликатов (похожих) графических файлов на жестком диске.

Конечно, в этой области еще пахать и пахать. Но, как говорится, ставьте очень высокие цели, а течение жизни снесет.

А что вы имели в виду, когда сказали, что Яндекс понимает словосочетиния? Я этого не вижу:-( Неужили, если слова стоят в разных концах предложения, но являются при этом, например, подлежащим и сказуемым, они найдутся, как смысловые словосочетание?

Вообще, я вижу три основные по смыслу группы понятий, которые могут заинтересовать пользователя посковой системы:

1.ПРЕДМЕТ

2.ДЕЙСТВИЕ

3.КАЧЕСТВО

На основе этих понятий можно построить следующую схему содержания

1-2-уровней:

1.ПРЕДМЕТ (П). Означает предмет в широком смысле: лицо, предмет,

явление, понятие, и т.д., в т.ч. - действие или качество.

1.1.Предметы, описывающие различные аспекты П.

1.2.Действия, совершаемые над П.

1.3.Действия, совершаемые П.

1.4.Качества П.

2.ДЕЙСТВИЕ (Д). Сюда входят любые действия, в т.ч. протекающие сами по себе,

без их производителя.

2.1.Предметы, над которыми осуществляется Д.

2.2.Предметы, которые осуществляют Д.

2.3.Качества Д.

3.КАЧЕСТВО (К). Сюда входят качества предмета и качества действия.

3.1.Предметы, имеющие данное К.

3.2.Действия, имеющие данное К.

Хотелось бы все это обязательно реализовать.

R
На сайте с 28.12.2003
Offline
4
#6

недостаток Яndex'a : нет удобного интерфейса построения запроса реализующего весь язык запросов http://www.yandex.ru/ya_detail.html

у других тоже самое :)

пишу а в "бэкграунде" вспоминаются лекции по системам искусственного интеллекта, там вроде нечто подобное было, всякие сигматические цепи, семантические связи...

не представляю себе систему реального времени которая реализует достаточно хорошо все ваши пожелания :)

остановите меня или я найду точку опоры
M
На сайте с 02.04.2004
Offline
0
#7

Еще вот что бы я предложил поисковым системам. Нужна обратная связь от пользователей. Это бы помогло в борьбе с "антипоисковыми системами", т.е. поисковым спамом.

Вот два из возможных вариантов, как бы это могло быть. Можно и как-то по другому, это лишь примеры, которые я придумал.

Вариант 1, самый примитивный и ручной. Возле каждой ссылки в результатах поиска поставить кнопку "эта страница совершенно бесполезна". Потом админы поисковика просматривают страницы, на которые были "жалобы" (или на кого жалоб больше всего) и удаляют из базы явно спамерские страницы.

Вариант 2, автоматический. В результатах поиска появляется переключатель "оцените эту ссылку", допустим, по пятибалльной шкале.

Потом эти результаты как-то учитываются в результатах поиска.

Разумеется недостатком этого варианта является то, что сразу начнутся попытки злоупотребления (накрутка), с которыми придется бороться.

Р
На сайте с 05.11.2003
Offline
31
#8
Вариант 1, самый примитивный и ручной. Возле каждой ссылки в результатах поиска поставить кнопку "эта страница совершенно бесполезна". Потом админы поисковика просматривают страницы, на которые были "жалобы" (или на кого жалоб больше всего) и удаляют из базы явно спамерские страницы.
Вариант 2, автоматический. В результатах поиска появляется переключатель "оцените эту ссылку", допустим, по пятибалльной шкале.
Потом эти результаты как-то учитываются в результатах поиска.

😂 Ага, вот тогда чем будет заниматься большинство веб-мастеров - сидеть и кликать на ссылку "отстой" относящуюся к сайтам конкурентов, и оценивать на еденицу.

[Удален]
#9

Да зачем сидеть и кликать, автоматизировать это можно.

M
На сайте с 29.03.2004
Offline
13
#10
Как писал Interitus
Да зачем сидеть и кликать, автоматизировать это можно.

Полностью согласен, в наших условиях введение подобной схемы даже постояльцев из 10ки вытолкнет ;)

"Contra factum non datur argumentum". Против фактов аргументы бессильны.
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий