Исследования терминосистемы

123
spark
На сайте с 24.01.2001
Offline
130
#11

В качестве прикола. Как различные народы озвучили @

@ Catalan: arrova

@ Czech: zavinac (оселедець)

@ Danish: snabel-a (слонячий хобот-a)

@ Dutch: apestaart (мавпячий хвіст)

@ Finnish: kissanhnt (котячий хвіст)

@ French: arrobase

@ German: klammeraffe (мавпа, що гойдається)

@ Hebrew: shablul (струдель)

@ Hungarian: kukac (хробак)

@ Italian: chiocciola (равлик)

@ Korean: dalphaengi (равлик)

@ Norwegian: grisehale (свинячий хвіст)

@ Polish: malpa (мавпа)

@ Russian: sabachka (песик)

@ Serbian: ludo-a (божевільне a)

@ Spanish: arroba (1 arroba = 25 фунтів)

spark
На сайте с 24.01.2001
Offline
130
#12

"Темы" были выбраны такие.

Рубрика

1) Вступ до інтернету

2) Користування (браузери, пейджери, інші програми)

3) Доступ, хостинг, провайдери

4) Навігація, доменні імена. Пошук, каталоги

5) Веб-дизайн та розробка

6) Інтернет-статистика, аналітика

7) Інформаційна безпека

8) Електронная пошта

9) Інтернет-спільноти

10) Інтернет-банкінг,білінг+

11) Оптимізація сайту, просування

12) Реклама

13) Тематичні сайти

14) Словники

На полноту, как оказалось уже в процессе, не претендует. Геймерский сленг весь остался за бортом, например.

Частотные словари создавались общий и отдельно для каждой тематики.

Длина общего текстового файла 217502 словоупотребления, 12382 слов.

Выборки по тематикам, например "Информационная безопасность", - 20988 словоупотреблений, 3009 слов.

Активный-пассивный словари рассматривать проблематично. Поскольку вся выборка из живых текстов, видимо, это активный словарь полностью.

Различными методами выделено 455(частотные методы) + 751(словарные)

Дефиниции уже имели 543, вот из этих процент пассивных можно было бы посмотреть, но я этого не делал, меня больше процессы заимствования и адаптации терминов интересовали.

pro-maker
На сайте с 08.12.2003
Offline
281
#13

spark, спасибо, уточните - смотрели только одиночные слова, поскольку цель была по терминам?

И, пожайлуста, самое простое, что такое "тематика" или где можно смотреть? :)

spark
На сайте с 24.01.2001
Offline
130
#14

Тематика, она же рубрика :) - зона выборки, относящаяся к определенной теме, в нее входят документы, посвященные, например, информационной безопасности в применении к интернет-технологиям, банкинга и т.п. Список выше. Объем такой подвыборки старался выдерживать в районе 20 тыс. словоупотреблений.

По двусловным терминам - рассматривались только адъективные словосочетания наиболее частотных прилагательных. Я вообще планировал и другие научиться определять, Слава Тихонов мне обещал помочь программно, но не срослось пока, он был занят Новотекой. Так что продолжать есть куда :)

По морфемам - выделялись только продуктивные морфемы, которые могут быть признаком терминологичности единицы. Ну, типа -инг и т.п.

pro-maker
На сайте с 08.12.2003
Offline
281
#15
spark:
она же рубрика

Этого мне и не хватало. Еще раз спасибо. :)

spark
На сайте с 24.01.2001
Offline
130
#16

Если вас интересуют соотношения многословных/однословных терминов, то есть данные (не мои) по другим подъязыкам.

На матеріалі 10 тис. російських стандартизованих термінів, проаналізованих І.В. Волковою (2, 77), однослівних виявилося тільки 10,2%, двослівних 36,2%, трислівних і більше – 53,6%
VT
На сайте с 27.01.2001
Offline
130
#17

offtopic, но все же.

Антон, смотри, как бы тебе сейчас за использование украинского языка репутацию на форуме не начали убивать.

Есть тут деятели - мне, например, недавно уже снимали очки только за то, что я из Киева. Мелочь, конечно, но весьма плохо пахнет.

spark
На сайте с 24.01.2001
Offline
130
#18

О, на ловца и зверь бежит. Сила не в репутации, брат :) Ты не хочешь, все же продолжить с двусловными терминами ради спортивного интереса? :)

SS
На сайте с 03.09.2004
Offline
141
#19
Vyacheslav Tikhonov:
Антон, смотри, как бы тебе сейчас за использование украинского языка репутацию на форуме не начали убивать.

Это ерунда.

Настоящая репутация - это не циферки под аватаром. Если убавят циферки - напишите, востановим быстро.

Vyacheslav Tikhonov, spark - Вы оба здесь очень давно и пользуетесь заслуженным уважением как у старожилов, так и у бОльшей части молодежи.

«Клянусь своей жизнью и любовью к ней, что никогда не буду жить ради другого человека и никогда не попрошу и не заставлю другого человека жить ради меня» (с) Джон Галт
VT
На сайте с 27.01.2001
Offline
130
#20
Это ерунда

Да я понимаю. Просто нехорошо смешивать профессиональные интересы с политикой.

О, на ловца и зверь бежит. Сила не в репутации, брат Ты не хочешь, все же продолжить с двусловными терминами ради спортивного интереса?

Антон, я-то и не прочь, да все времени не хватает. Сам понимаешь ;)

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий