"C оптимизацией вяжется" посредством SE.
Еще вопрос.
Вообще говоря, имея в своем распоряжении инвертированный файл, - можно ВОССТАНОВИТЬ исходный файл ... (правда, наверное, в нем будут потеряны мелкие детали, - типа заглавных букв!)
Однако, - правильно ли я понимаю, - что SE так не делают, но - хранят "у себя" наряду с инвертированными файлами также весь проиндексированный контент в виде "обычных" (не-инвертированных) файлов?
Нет. Я спрашиваю: если юзер ввел запрос "Властелин колец", а следом: "туалетная бумага", - то СЧИТАЕТСЯ, что эти два запроса "ассоциированы"? Типа - не случайно же он их подряд ввел!
Скажите пожалуйста, это - единственный пример?
- то есть ассоциация - это ПОСЛЕДОВАТЕЛЬНЫЕ запросы?
Аааа! Понятно, но ... не понятно "ассоциации (что еще запрашивали пользователи, которые запрашивали введенный запрос)":
- где запрашивали?
- когда запрашивали?
- ...
В результатах, выдаваемых Яндексом, "под чертой" идут статьи с меткой "нестрогое соответствие".
Правильно ли я понимаю, что это как раз и есть результаты нечеткого поиска?
Если да, то они, - наверное, - отранжированы в соответствии с "мерой нечеткости"??
> Что с ним нужно делать?
Вы спрашиваете вообще или про меня лично?
Разные люди "работают с контентом" по разному ... но в целом это можно описать как:
а. извлечение "сведений", "знаний", "информации" необходимых для конкретной деятельности конкретного человека
б. в значительно меньшей мере, но тем не менее нужно указать - помещение в интернет какой-то собственной информации.
>Что, по-вашему, БАЗА ЗНАНИЙ, и как интернет может ею быть?
- это сложный вопрос, и в двух словах я не могу на него ответить. Но я имею некоторое представление о том, что принято ... у специалистов и advanced users ... называть "базами знаний", и ... что-то подобное и имел в виду, когда употреблял этот термин.
(Вы понимаете, что Вы как бы загнали меня в ситуацию "разгвора по понятиям", и поскольку я выбрал - принять этот вызов, а не стушеваться, - то я вынужден выдавать достаточно общие, философские формулировки!)
> Ответ на этот вопрос вам вряд ли скажет даже Яндекс. Но процент высокий.
- меня интересовало не точное значение, а Ваша оценка, чтобы понять, о чем собственно, был Ваш тезис. Кстати:Ученые подсчитали, какие падежи наиболее часто употребляются в текстах. На именительный падеж приходится 33 процента всех падежных форм, на родительный падеж – 24 процента, на винительный – 20 процентов, на остальные падежи (дательный, творительный, предложный – 23 процента). А вот в разговорной речи на именительный падеж приходится 50 процентов, на винительный – 20 процентов, на родительный – 15 процентов.
>Что такое СМЫСЛ и каким образом СЛОВОИЗМЕНЕНИЕ может его передавать?
Вы понимаете разницу между "хлебе" и "хлебом"?
Advanced, конечно ... это была опечатка.
ИНДИВИДУАЛЬНЫЙ ИНСТРУМЕНТАРИЙ нужен для РАБОТЫ с контентом (по-русски - содержимым) интернета - при отношении к последнему как к огромной БАЗЕ ЗНАНИЙ.
_______________
PS. "Нормальная форма" - это именительный падеж единственого числа, я правильно понимаю? И какая же доля (%) "употреблений существительных" приходится на нормальную форму?
Не говоря уже о том, что СЛОВОИЗМЕНЕНИЕ создает не только затруднения для несчастных "индексаторов", но еще и служит для ВЫРАЖЕНИЯ СМЫСЛА (в частности, - создает СВЯЗАННОСТЬ текста).
Посмотрел - с большим опозданием - эту дискуссиию, пытаюсь понять - о чем идет речь ...
- разве СУТЬ "семантической образЦОВОСТИ" может быть сведена к "набору терминов" (даже если - "с весами")???