spark

spark
Рейтинг
130
Регистрация
24.01.2001
Должность
dummy
Интересы
texts

См личные сообщения.

Пример есть, не привожу, чтоб не сглазить. Разница в выдаче - больше десяти позиций.

что делать? как с этим жить?

Вредный совет: грузить главную страницу в поп-андере, пока расслабившийся пользователь читает то, что ему действительно было нужно :)

Фраза переводится как

в чаще юга жил-был цитрус. да, но фальшивый экземпляр :)

По остальному позже. только что закончил, кстати, перевод канадского стандарта, не не бойтесь, не на IT :) очень спать хочется.

ЗЫ Совсем уж флейм, но если Вам не чужды проблемы переводов, переведите фразу

The quick brown fox jumps over a lazy dog :)

Если вас интересует методика составления этого конкретного словаря, то слова с частотой меньше 10 просто отсеивались, как не характерные для данной тематики. Весь ваш ряд, от которого вы устали, остался в фильтрате. Кстати, я вот не уверен что тираж, вираж и абордаж такие уж научные слова :) Вы просто привели ряд слов французского происхождения :)

Что же до IT терминологии, то через некоторое время все устаканится, вы не переживайте. А чтобы филологи не допускали ошибок, после каждого из них при нормальной процедуре сидит научно-технический редактор, который знает предмет. Как только появится терминологический стандарт, ошибок станет меньше.

А что до Кэролла, то игры ума и слов нужно переводить не дословно, а адекватно и баобабочка более уместна, чем ваш неологизм :).

Активный словарный запас культурного человека (случаи Эллочки людоедки не рассматриваются :)) 5000 слов. Но это так, к слову. Допускаю, что 1000 более частое явление.

Но словарь - парадигма. Мы же имеем дело с текстами - синтагмой. В них соблюдаются свои законы, в том числе статистические.

Распредилите этот словарь по Зипфу, и вы отсечете большую часть этой матрицы. Понятно, что во всех возможных вариантах сочетаний будут задействаны только слова первых рангов.

Немного из другой оперы, дистрибуция букв внутри слова. Но очень наглядно. В частотном словаре научно-технической лексики на 400 тыс. словоупотреблений всего 5 слов имеют исход (заканчиваются в словарной форме, без парадигмы) на "Ж".

В случае же устойчивых словосочетаний картина еще более простая, досточтимый сэр, но милостивый государь :)

Причем, на данный момент имеется обширнейшая лексикография русского языка, словари синонимов, упоминавшихся Вами омонимов, и словосочетаний - в том числе. Забейте этот словарь в машину, и в 80% случаев вам не останется, чего анализировать. Это я вам напоминаю, как носитель языка, такой шикарной лексикографии не имеющего :)

AiK

Не заставляйте меня парировать чем нибудь вроде "программер, не знающий языка должен программировать что-нибудь другое".

Про кожаный шар, которым начинали играть в футбол, позвольте вам не поверить и отнести на сложности перевода с английского. По-русски это до сих пор звучит как "набивной мяч".

Хармс - это как раз поэтика абсурда, в том числе неправильных словоупотреблений. Вы еще магнитофонные пленки "Аквариума", прокрученные задом наперед, начните анализировать с точки зрения фонетики.

Я имел ввиду всего лишь то, что каждое слово относится к какому-либо семантическому полю. И количество комбинаций существенно снижается. Слово может употребляться только со словами того же поля. То, что ваш папа называл контекстом, а филологи называют почему-то коммерческим словом дистрибуция.

Были попытки вычислять семантические расстояния между словами. Т.е. между синонимами оно - ноль. Между словами одного устойчивого словосочетания - единица и т.д. в пределах одного предложения.

В вашем примере с замками (омографы) как раз ничего определять не надо. "Темный замОк" - не употребляется и притянуто за уши, как и предыдущий кожаный шар. Любой анализ частоты употребления ваших убедительных примеров на достаточном массиве текстов нас рассудит.

Яндекс "кожаный шар" - страниц 170 "кожаный мяч" - страниц 4007.

"Кожаный шар" употребляется спортивными журналистами в качестве метафоры или синонима - и только. "костяной мяч" вообще не встречается.

А вот Alexa как-то не обозначал своей принадлежности к какому-нибудь поисковику

А Славе нужно только пожелать успехов на новом месте работы. Поиск из Пинга он, к счастью, не унес. Но развиваться он теперь перестанет,это точно :)

wolf

Яндекса (iseg, melkov, wawa), Рамблера (vs, Keva) и Апорта (misha).

Ай-ай-ай, про AlexA и Тихонова даже и не вспомнил, а еще модератор. Между тем, по части новаторста "три кита" очень скованы решением текущих технических проблем, не до того им.

msa

Уважаемый, я не матлингвист, я филолог и честно говоря не въезжаю в то, что вы пытаетесь здесь проповедовать, как ни стараюсь. Извините, но что такое коллоканты я знаю, а что такое ваши "сгустки" остается только догадываться. Что такое "прикрутить к дереву симплекс" и догадаться никогда не смогу.

И вообще, временами мне этот топик начинает напоминать "Сказку о тройке" и "эвристическую машинку".

- Что это у нее внутри?

- Внутре у меня неонка.

Не обижайтесь, ради бога. Считайте просто просьбой более внятно выражаться.

AiK

В языке приводимая Вами математика неуместна. Слова, к счастью, не комбинируются во всех возможных сочетаниях.

костяной шар - да

кожаный мяч - да

наоборот - нет

Всего: 1806