Исследования терминосистемы

12 3
spark
На сайте с 24.01.2001
Offline
130
4373

Вобщем, отдельную тему я завел. Работа пока не публиковалась, мне ее верстать лень, да и большая она для интернета, много ненужных цитат и ссылок. Ниже - объяснительная записка. На вопросы постараюсь ответить.

______________________________________________

Дана робота “Особливості функціонування української мови у терміносистемі інтернет-технологій ” проводилася з метою створення термінологічного банку слів на базі підмови “Інтернет-технології”, а також аналізу термінотворчих процесів цієї підмови. Також на мету ставилося дослідити характер функціонування професіоналізмів, сленгу, термінів та номенклатурних назв, шляхи побудови та запозичення термінів, дослідження однослівних та ад’єктивних темірносполук.

Об’єктом дослідження є субмова інтернет-технологій.

Предметом дослідження є терміни, професіоналізми та номенклатурні назви, що утворюють дану підмову, зокрема її терміносистему.

Актуальність теми ми вбачаємо у необхідності створення спеціальної термінологічної служби ТБД, яка б забезпечувала термінологів-укладачів словників оперативною інформацією про функціонування терміна в тексті. Крім того, інтернет є порівняно молодою технологією, термінологічна база якої ще перебуває на етапі становлення, що дозволяє спостерігати термінотворчі процеси безпосередньо в їх розвитку. Аналіз проводився на матеріалах, що датуються 2000-2005 роками. Можливо, створення ТБД зможе впливати на розвиток цього процесу.

Матеріал дослідження – стандартна зональна вибірка текстів з вказаної тематики, понад 217 тисяч слововживань, зібраних з відкритих джерел, публікацій в інтернеті. А також сформований тлумачний словник на 543 терміни, зведений з понад 10 джерел, зокрема глосаріїв, окремих визначень, галузевих словників тощо.

Використовувалися метод кількісного аналізу текстів та описовий метод експертних оцінок. Розроблявся напрям взаємодії між словником і текстом у напрямку від тексту до словника. Вибірка опрацьовувалася зі складанням частотного словника і подальшим зіставленням експертних оцінок фахівців в галузі інтернет-технологій. Проводився лексико-семантичний аналіз текстів з метою пошуку критерію термінологічності одиниці. Також використовувався метод побудови дерева залежності та формування семантичної сітки основних термінів.

Робота проводилася в декілька етапів.

Перший етап включав в себе:

- консультації з фахівцями з інтернету, ідеографічний, семантичний та частотний аналіз запропонованих фахівцями текстів;

- визначення принципів формування вибірки;

- визначення методики пошуку релевантних документів з інтернетної тематики у відкритих джерелах, зокрема в мережі Інтернет, з урахуванням принципів роботи іноформаційно-пошукових систем;

- пошук документів та формування стандарної зональної вибірки необхідного обсягу із зонами, сформованими за тематичною ознакою.

На другому етапі вибірка оброблялася з використанням пакету алгоритмів і програм автоматичного морфологічного аналізу української мови (АМА) та пакету укладання частотного словника (ЧС) з визначенням абсолютної (АЧ) та відносної (ВЧ) частот вживання слів.

На третьому етапі розроблялися можливі методи виділення однокомпонентних термінів з отриманого словника та найпродуктивніших компонентів багатокомпонентних термінів. Проводилося спостереження за термінотворчими процесами, пошук неологізмів тощо. Результати зіставлялися зі зведеним тлумачним словником інтернет-технологій з метою визначення його повноти та претендентів на терміни, що є необхідною складовою терміносистеми, але не мають визначень.

Структура роботи.

1. Вступ

2. Теоретична частина

2.1. Основи термінотворення

2.2. Статистичні методи дослідження. Типи вибірок

2.3. Основи пошуку інформації в інтернеті

2.4. Галузь інтернет технологій

2.4.1. Особливості формування терміносистеми

2.4.2. Особливості сфери використання термінів

3. Напрямок дослідження від тексту до словника

3.1. Формування вибірки

3.2. Укладання частотного словника

3.3. Методи виділення термінів з текстів

3.3.1. Виділення термінів шляхом аналізу незареєстрованих в орфографічному словнику слів

3.3.2. Виділення термінів шляхом аналізу частотних характеристик текстів

3.3.3. Виділення продуктивних основ при словотворі основоскладанням та словоскладанням

3.3.4. Виділення продуктивних службових морфем при афіксальному словотворі

3.3.5. Виділення продуктивних прикметників ад’єктивних сполук

3.3.6. Виділення термінів за їх оформленням в тексті

“Метод лапок”

”Метод дужок”

4. Напрямок дослідження “від словника до тексту”

5. Процеси побудови нових термінів

5.1. Використання внутрішніх ресурсів мови

5.1.1. Карбування похідних слів

5.1.2. Розвиток нових значень у вже існуючих слів (лексико-семантичний спосіб словотвору)

5.1.3. Складання основ (морфологічний спосіб словотвору)

5.1.4. Укладання словосполучень (лексико-синтаксичний спосіб словотвору)

5.2. Пряме запозичення терміноелементів

5.2.1. Повне запозичення (внутрішня форма разом із зовнішньою формою)

5.2.2. Неповне запозичення (тільки внутрішня форма)

5.2.3. Неповне запозичення (тільки зовнішня форма)

5.3. Вигадування штучних слів

6. Висновки

Висновки.

1. Запропонований метод укладання частотних словників з певної галузі на матеріалі функціонування термінів в “живих” текстах дозволяє подолати певні недоліки А саме:

· Обсяг та “тематичний фокус” словника ми можемо варіювати досить гнучко ще на стадії формування вибірки. Тематика може бути як загальною (наприклад, принципи організації мережі), так і вузько-тематична ( наприклад, реклама в інтернеті);

· Ми можемо формувати вибірку з текстів різної функціональної та стильової приналежності (монографії, науково-популярні статті, учбові реферати, доповіді, технічні умови тощо);

· Словник укладається філологами з консультаціями з фахівцями в певних „контрольних точках”;

· На словниковий індекс впливає вживаність того чи іншого терміна в межах конкретних текстів, а не спеціалізація укладача;

· У випадку перекладних термінів перевага надається варіанту перекладу, що отримав найбільше розповсюдження, тобто має місце „колективна творчість” багатьох перекладачів та фахівців;

· Обсяг словника обмежується частотними, тобто найуживанішими, словами. Існує велика ймовірність того, що і при користуванні таким словником, до цих словарних статей користувач звертатиметься найчастіше.

· Структура словника визначається за структурою монографій, що освітлюють галузь знань якнайповніше.

· При опрацюванні технології побудови словників на вибраних галузях знань вона може застосовуватися до будь-яких тематик. Час укладання словників при цьому значно скоротиться і відповідатиме більш жорстким вимогам сьогодення.

2.

В межах даної роботи запропонована методика частково випробовувалася при укладанні та дослідженні частотного словника підмови інтернет-технологій. Робота показала, що професійні підмови мають певну специфіку, яку необхідно враховувати при укладанні словників.. До особливостей підмови екології можна віднести таке:

· Більшість термінів утворюється шляхом повного запозичення з американської англійської (Інтернет, сайт, сервер). Інколи запозичення відбувається через метамову (пошуківець – поисковик через російську, файрвол – брандмауер, гейтвей – шлюз через німецьку, пассворд – пароль через французьку тощо)

· При запозиченні зовнішньої форми використовується як транскрипція, так і транслітерація. Це призводить до паралельного вживання різних написань одного й того ж терміна (браузер, броузер, бровзер; файрволл, фаєрвол; аккаунт, акаунт, екаунт тощо) З часом написання усталюється без втручання філологів. Є сенс при укладанні словників орієнтуватися на такі написання, що вже усталилися, що легко перевіряється за допомогою пошукових машин.

· Запозичення термінів дуже часто відбувається поступово: спочатку в англійському написанні, потім в транскрипції, згодом – в перекладі або іншій адаптації до рідної мови (Internet, мережа Інтернет, (невідмінюване), інтернет (чол.р., 2 відм), Мережа. Зафіксовані випадки композитних (англійсько-українських) написань в цих “ланцюжках запозичень (web design, web-дизайн, веб-дизайн, вебдизайн)

· Велику частину термінології складають похідні слова від запозиченого з англійської терміна. Це в оcновному утворення прикметників (Індекс-ований, авторизацій-ний, анімов-аний, антивірус-ний, біт-ний) та дієслів ( дзеркал-итися, логін-итися, про-індекс-увати, про-інстал-ювати). Різновидом цього можна вважати ситуацію, коли англійський термін отримує рід та парадигму відмінювання за певною відміною (букмарк-ах, веб-борд-у, у веб-лозі, гестбука)

· Зафіксовано також розвиток нових значень у вже існуючих українських слів (вушка, український квадрат, хмарочос)

· Має місце словотвір осново- і словоскладанням. При цьому також можуть виникати паралельні вживання термінів (багатопроцесорний, мультипроцесорний)

· Широко розповсюджені ад’єктивні сполуки, особливо коли запозичується термін з іншої галузі. (Електронний обмін даними, електронний переказ коштів, електронна комерція, електронний банкінг, електронна сертифікація, система електронних платежів, електронний оператор, електронний підпис, електронний цифровий підпис, електронна пошта, електронний лист, електронний гаманець, електронна дошка оголошень, електронні ЗМІ, електронний бізнес, електронний підручник, електронне спілкування, електронна публікація, електронний ключ тощо) Серед продуктивних прикметників також лексеми Електронний (681), інформаційний (500), пошуковий (261), поштовий (339), програмний (279), комп’ютерний (200), віртуальний (63), серверний (32), мережевий (101), інтерактивний (56)

· Наявні словники з інтернет-термінології поки що не систематизовані, терміносистемі бракує багатьох визначень термінів.

Avatar
На сайте с 18.05.2003
Offline
168
#1

spark, ты чего, издеваешься?

Это такой новый вид национализма? Мне например интересно, что ты написал. Но осмыслить я этого не смогу, не силен в буквах "i" :(

Тебе мнение русскоязычных Коллег интересно? Если нет - вопрос снимаю, если да - то не понимаю, зачем...

Блин. Вот ведь и интересно, о чем речь, а ведь и хрен поймешь!...

И ведь серьезный человек публикует (поэтому вдвойне интересно!)

6666
На сайте с 10.01.2005
Offline
505
#2

:d Алексей, топик то про украинскую интернет терминологию. Не говоря о том, что на самом деле все понятно.

Каждое мое сообщение проверила и одобрила Елена Летучая. (c) Для меня очень важно все что Вы говорите! (http://surrealism.ru/123.mp3) .
spark
На сайте с 24.01.2001
Offline
130
#3

Avatar, никого не хотел обидеть. Оказалось, что некоторые из "оппонетов" украинский помнят :) Обсуждать готов по-русски.

Это объяснительная записка к работе, переводить ее нет возможностей.

Вобщем, я пытался отработать алгоритмы выделения "претендентов на термины" из стандартной выборки текстов, собранной из открытых источников с помощью Яндкса и Гугля (украинских) и сверял это потом с существующими словарями.

Avatar
На сайте с 18.05.2003
Offline
168
#4

Твою мать!... 😡

Ну тада вопрос снят 😂/ Я кретин 😂 (хотя мне все равно тяжко осмыслить не родное написание, но таки ИНТЕРЕСНО)

[Удален]
#5

spark, кандидатскую прощупываешь? )

Не филфак КНУ, случаем, заканчивал? )

spark
На сайте с 24.01.2001
Offline
130
#6

Это магистерская. Его.

[Удален]
#7

spark, Значит, коллеги. Правда, у меня инфил) Уже отстрелялся)

euhenio
На сайте с 21.09.2001
Offline
357
#8

А в чем прикол, зачем все это? :)

Ниасiлил.

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
spark
На сайте с 24.01.2001
Offline
130
#9

Меня просили выложить, я выложил. Прикола нет :)

Ну, тебе было бы интересно, что естественному языку выделенный тобой диапазон плотности ключевика 3.5-7% полностью соответствует. Вывод - будьте естественны, и вас полюбят СЕ :)

pro-maker
На сайте с 08.12.2003
Offline
281
#10
Avatar:
spark, ты чего, издеваешься?

Avatar, я спрашивал.

spark:
некоторые из "оппонетов" украинский помнят

И о так называемом "вреде русской культуры" не забыли...

spark, спасибо, очень познавательно.

1. Определите термин "тематика", можно в разных толкованиях - для начального оценочного прикида.

2. Можете ли показать какие-то цифры/соотношения в поисковом приложении: морфемы (усеченные слова), пасивный/активный словари, пересечение наборов слов в ссылках со словарем тематики...

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий