См личные сообщения.
Пример есть, не привожу, чтоб не сглазить. Разница в выдаче - больше десяти позиций.
Вредный совет: грузить главную страницу в поп-андере, пока расслабившийся пользователь читает то, что ему действительно было нужно :)
Фраза переводится как
в чаще юга жил-был цитрус. да, но фальшивый экземпляр :)
По остальному позже. только что закончил, кстати, перевод канадского стандарта, не не бойтесь, не на IT :) очень спать хочется.
ЗЫ Совсем уж флейм, но если Вам не чужды проблемы переводов, переведите фразу
The quick brown fox jumps over a lazy dog :)
Если вас интересует методика составления этого конкретного словаря, то слова с частотой меньше 10 просто отсеивались, как не характерные для данной тематики. Весь ваш ряд, от которого вы устали, остался в фильтрате. Кстати, я вот не уверен что тираж, вираж и абордаж такие уж научные слова :) Вы просто привели ряд слов французского происхождения :)
Что же до IT терминологии, то через некоторое время все устаканится, вы не переживайте. А чтобы филологи не допускали ошибок, после каждого из них при нормальной процедуре сидит научно-технический редактор, который знает предмет. Как только появится терминологический стандарт, ошибок станет меньше.
А что до Кэролла, то игры ума и слов нужно переводить не дословно, а адекватно и баобабочка более уместна, чем ваш неологизм :).
Активный словарный запас культурного человека (случаи Эллочки людоедки не рассматриваются :)) 5000 слов. Но это так, к слову. Допускаю, что 1000 более частое явление.
Но словарь - парадигма. Мы же имеем дело с текстами - синтагмой. В них соблюдаются свои законы, в том числе статистические.
Распредилите этот словарь по Зипфу, и вы отсечете большую часть этой матрицы. Понятно, что во всех возможных вариантах сочетаний будут задействаны только слова первых рангов.
Немного из другой оперы, дистрибуция букв внутри слова. Но очень наглядно. В частотном словаре научно-технической лексики на 400 тыс. словоупотреблений всего 5 слов имеют исход (заканчиваются в словарной форме, без парадигмы) на "Ж".
В случае же устойчивых словосочетаний картина еще более простая, досточтимый сэр, но милостивый государь :)
Причем, на данный момент имеется обширнейшая лексикография русского языка, словари синонимов, упоминавшихся Вами омонимов, и словосочетаний - в том числе. Забейте этот словарь в машину, и в 80% случаев вам не останется, чего анализировать. Это я вам напоминаю, как носитель языка, такой шикарной лексикографии не имеющего :)
AiK
Не заставляйте меня парировать чем нибудь вроде "программер, не знающий языка должен программировать что-нибудь другое".
Про кожаный шар, которым начинали играть в футбол, позвольте вам не поверить и отнести на сложности перевода с английского. По-русски это до сих пор звучит как "набивной мяч".
Хармс - это как раз поэтика абсурда, в том числе неправильных словоупотреблений. Вы еще магнитофонные пленки "Аквариума", прокрученные задом наперед, начните анализировать с точки зрения фонетики.
Я имел ввиду всего лишь то, что каждое слово относится к какому-либо семантическому полю. И количество комбинаций существенно снижается. Слово может употребляться только со словами того же поля. То, что ваш папа называл контекстом, а филологи называют почему-то коммерческим словом дистрибуция.
Были попытки вычислять семантические расстояния между словами. Т.е. между синонимами оно - ноль. Между словами одного устойчивого словосочетания - единица и т.д. в пределах одного предложения.
В вашем примере с замками (омографы) как раз ничего определять не надо. "Темный замОк" - не употребляется и притянуто за уши, как и предыдущий кожаный шар. Любой анализ частоты употребления ваших убедительных примеров на достаточном массиве текстов нас рассудит.
Яндекс "кожаный шар" - страниц 170 "кожаный мяч" - страниц 4007.
"Кожаный шар" употребляется спортивными журналистами в качестве метафоры или синонима - и только. "костяной мяч" вообще не встречается.
А Славе нужно только пожелать успехов на новом месте работы. Поиск из Пинга он, к счастью, не унес. Но развиваться он теперь перестанет,это точно :)
wolf
Ай-ай-ай, про AlexA и Тихонова даже и не вспомнил, а еще модератор. Между тем, по части новаторста "три кита" очень скованы решением текущих технических проблем, не до того им.
msa
Уважаемый, я не матлингвист, я филолог и честно говоря не въезжаю в то, что вы пытаетесь здесь проповедовать, как ни стараюсь. Извините, но что такое коллоканты я знаю, а что такое ваши "сгустки" остается только догадываться. Что такое "прикрутить к дереву симплекс" и догадаться никогда не смогу.
И вообще, временами мне этот топик начинает напоминать "Сказку о тройке" и "эвристическую машинку".
- Что это у нее внутри?
- Внутре у меня неонка.
Не обижайтесь, ради бога. Считайте просто просьбой более внятно выражаться.
В языке приводимая Вами математика неуместна. Слова, к счастью, не комбинируются во всех возможных сочетаниях.
костяной шар - да
кожаный мяч - да
наоборот - нет