Будущее IR-систем

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#31

Nita, а причем здесь разница? Абсолютно естественно, что более узкий запрос встречается реже...

Кстати, наши усилия в ряде случаев приводят к тому, что необходимости в формулировании более узких запросов у пользователя не возникает.

Кстати, что касается открытия новых фактов - мне вспомнился отрывок из "Мир Сатаны" Пола Андерсона - точки отсчета "я" и "деньги", найти все возможные взаимосвязи...

N
На сайте с 04.03.2003
Offline
14
#32
Как писал Ashmanov
Рассуждение некорректное - словосочетание из любых трёх слов всегда на порядки менее частотно, чем из двух, причём неважно, как считается частота - по вхождениям на сайтах или по запросам. Закон Ципфа в разных своих проявлениях.

227042 web site design

7290 web site design company

5098 site design

Никогда не говори "никогда", дорогуша !:p

В большинстве случаев - да, согласна.

Но не всегда !

P.S. (Удалено по просьбе хозяина форума) ;)

N
На сайте с 04.03.2003
Offline
14
#33
Как писал Gray
Nita, а причем здесь разница? Абсолютно естественно, что более узкий запрос встречается реже...
Кстати, наши усилия в ряде случаев приводят к тому, что необходимости в формулировании более узких запросов у пользователя не возникает.

Вот именно, в РЯДЕ СЛУЧАЕВ. Когда нет достойных конкурентов.

А иногда приходится под более узкий запрос специальную страничку создавать

:(

Ashmanov
На сайте с 21.11.2000
Offline
66
#34

Уважаемая Нита, я, собственно, и не хотел Вас обаивать умными высказываниями, так что можете смело разочаровываться. Я, возможно, даже не стану стреляться.

Так мне никогда не говорить всегда? Или всегда не говорить никогда? Прямо не знаю, как Вам потрафить!

А пример, по-моему, опять некорректный.

Насколько я понимаю по-английски, site и web site - могут означать разные вещи (site слово старинное, означает совсем не сайт в интернете, в отношении фирмы может означать просто офис или стенд на выставке). Носитель языка, видимо, может сказать для краткости и site design, когда захочет говорить именно о дизайне интернет-сайта, и в Интернете так и говорят по большей части, но точнее всё-таки звучит web site design.

Думаю, что этим может объясняться меньшее число более общих запросов.

Может, их вообще производят русскоговорящие?!!

На Ваших трёх- и четырёх-словных сочетаниях, как видим, имеется примерно тот же закон.

С уважением, Игорь Ашманов Все для оптимизации (рассылка, сервисы): www.optimization.ru (www.optimization.ru) Сервис по созданию собственных поисковиков: www.flexum.ru (www.flexum.ru)
Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#35
227042 web site design
7290 web site design company
5098 site design

Нита, мне далеко сейчас лезть за статистикой, но я все же за ней слазил.

программы 30275

программа тв 12749

бесплатные программы 8080

программа телепередач 5096

программа передач 4229

скачать программы 3589

програмы 1565

Что это означает? А ничего не означает. Ошибки и малоупотребимые формы запросов не являются доказательствами чего-либо. В 90% случаев слово "site" употребляется в составе выражения "web site" - вот и вся причина мнимого отклонения.

Еще одно такое заявление и я в тебе разочаруюсь

Еще немного подобного тона и я перестану терпеть хамство от девушки, тем более в столь серьезной теме.

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#36
Насколько я понимаю по-английски, site и web site - могут означать разные вещи (site слово старинное, означает совсем не сайт в интернете, в отношении фирмы может означать просто офис или стенд на выставке).

Боюсь ошибиться, но, по-моему, site - есть сознательный mispelling слова sight, что довольно часто встречается у американцев (nite, luv, coz` и т.д.).

Оригинальное site в английском - слово действительно старинное, произносится [`sIt], происхождения французского.

N
На сайте с 04.03.2003
Offline
14
#37
Как писал Ashmanov
Так мне никогда не говорить всегда?

Yep !

ДОГАДАЛСЯ!

Почти в каждом правиле есть исключение.

Как писал Ashmanov
Может, их вообще производят русскоговорящие?!!

Ага....или негры.:D

Так вот, когда ищут "site design"

подразумевается "web site design"

В данном случае трехсловные запросы превышают двухсловные.

Поэтому ваше рассуждение о том что "словосочетание из любых трёх слов всегда на порядки менее частотно, чем из двух" некорректно.

:p

N
На сайте с 04.03.2003
Offline
14
#38
Как писал Gray

Что это означает? А ничего не означает. Ошибки и малоупотребимые формы запросов не являются доказательствами чего-либо. В 90% случаев слово "site" употребляется в составе выражения "web site" - вот и вся причина мнимого отклонения.

Ничего себе малоупотребительное - 5098 в месяц по Overture.

А представьте сколько по Google ?

Я не собираюсь доказывать что слососочетаний из трех слов больше чем из двух.

Но как мы видим в этом правиле есть исключение.

Дело в том что мистер Ашманов применил веское слово всегда , которое подразумевает так и только так и не иначе.

А представьте что начинающий русский оптимизатор, начитавшись мистера Ашманова, заоптимизирует страничку под "site design" вместо

"web site design" ??? Сколько потенциальных клиентов он потеряет ? ;)

Ashmanov
На сайте с 21.11.2000
Offline
66
#39

А когда ищут "програмы", подразумеваются "программы". Ну и что?

Мы и говорим о том, что site design, возможно, не вполне грамотное выражение, поэтому его реже задают в строке запроса.

А может быть, это и не так, не знаю.

Вообще интересно было бы исследовать "ореол" среднего запроса - ошибки, опечатки вокруг него и более многословные уточнения его.

Тут будет принципиальное отличие между "моносемантическими" запросами (типа "антивирус", "раскрутка", "крэки", "порно"), которые при уточнении не теряют основного смысла, и полисемантическими ("программа"), которые являются просто сборищем омонимов и при уточнении распадаются на совершенно не связанные, независимые кластеры.

При этом заметим, что под что именно оптимизировать страничку - большой вопрос. Вообще оптимизировать сайт под много низкочастотных запросов часто имеет смысл - интеграл по ним часто больше, аудитория лучше, а частотный запрос слишком конкурентен. Особенно в случае омонимии частого общего запроса, когда половина результатов поиска вообще не про то.

Можно оптимизировать страничку и под грамматические ошибки и опечатки - по тем же соображениям (см. в нашем сборнике статью Павла Ряйконнена).

А спор-то о чём? Что не надо было говорить "всегда"? Хорошо, заменяю на "в подавляющем большинстве случаев".

Ну, теперь нужно вспомнить, о чём таком содержательном была речь до этого.

MG
На сайте с 18.10.2002
Offline
27
#40
Как писал Ashmanov
А вот Консультант плюс, думаю, считает, что пример таки удачный.
Они тщательно готовят данные (сотни тысяч многоязычных документов), обеспечивают максимальную актуальность их, продают аналитический сервис над ними и продают успешно, более чем на 100 млн. евро в год - в чём же здесь неудача?
[/QUOT]
С точки зрения маркетинга они молодцы. С точки зрения IR, если его понимать как поиск и извлечение информации с использованием компьютеров, а не сотни аналитиков, то этого там нет вообще. Как в обработке, так и в сервисе поставляемых оболочек.

Я не знаю, какой у Вас опыт работы с правовыми базами данных, а вот мы в настоящий момент мучительно долизываем оболочку такой базы для крупного заказчика.

Определенный есть :). И несколько таких систем, в т.ч. и для крупных заказчиков сделал.

Например, одно из самых важных свойств правовой базы данных - связь с предыдущими редакциями документа. Потому что, например, некоторые законы выходят в виде этаких макрокоманд на "гиперссылках" - "пункт такой-то параграфа такого-то читать в следующей редакции...". И нужно сделать все "провязки", причём когда - заранее, а когда и динамически.

Именно о выделении таких объектов я и писал в начале данной темы. На самом деле, это не связь редакций, а связь изменяющий-изменяемый. Редакции несколько более противная вещь, просто надо хранить историю изменения объекта, нечто вроде темпоральных БД. Если брать текущую версию того-же К+ они этим особенно не заморачиваются, рассматривая каждую редакции как отдельный объект базы. Короче, пошли частности :).

А насчёт того, что в Интернете информации есть - это иллюзия. Там много дряни и неполных данных. В этом - проблема!

Именно это я имел в виду, в И-нете много зашумленной информации и часта ситуация, когда пользователь не может найти имеющуюся в шуме. В любых "тематических" базах более распространена обратная ситуация - шума нет, но более важна полнота.

Интернетчики просто привыкли рыться в мусоре, Рамблер/Яндекс с Гуглом слегка помогают в этом, вот все и рады донельзя.

Просто интернет кажется всем понятнее, по крайней мере в этой конфе.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий