Применение специализированных корпусов в анализе полисемантических терминов

Abstract

Эта статья посвящена области лингвистики и фокусируется на важной роли оцифрованных текстовых коллекций, известных как корпусы, в лингвистических исследованиях. Корпусы служат незаменимыми ресурсами, предоставляющими обширный набор данных для лингвистического анализа. Их полезность значительно увеличивается благодаря программам конкорданса, специализированному программному обеспечению, которое облегчает детальное исследование текстовых коллекций. Эти программы, особенно их функция конкорданса, играют ключевую роль, позволяя лингвистам исследовать языковые модели, находить совпадения и выполнять расчеты частотности. Цель данной статьи – прояснить методологии и приложения анализа корпусов в лингвистике, предоставив всесторонний обзор процессов и инструментов, используемых для извлечения значимых выводов из текстовых корпусов.

Source type: Conferences
Years of coverage from 2022
inLibrary
Google Scholar
Branch of knowledge
CC BY f
34

Downloads

Download data is not yet available.
To share
Rajabova Г. (2024). Применение специализированных корпусов в анализе полисемантических терминов. Topical Issues of Language Training in the Globalized World, 1(1). Retrieved from https://www.inlibrary.uz/index.php/issues-language-training/article/view/33564
Gulnoza Rajabova, Uzbek State World Languages University
UzSWLU, senior teacher
Crossref
Сrossref
Scopus
Scopus

Abstract

Эта статья посвящена области лингвистики и фокусируется на важной роли оцифрованных текстовых коллекций, известных как корпусы, в лингвистических исследованиях. Корпусы служат незаменимыми ресурсами, предоставляющими обширный набор данных для лингвистического анализа. Их полезность значительно увеличивается благодаря программам конкорданса, специализированному программному обеспечению, которое облегчает детальное исследование текстовых коллекций. Эти программы, особенно их функция конкорданса, играют ключевую роль, позволяя лингвистам исследовать языковые модели, находить совпадения и выполнять расчеты частотности. Цель данной статьи – прояснить методологии и приложения анализа корпусов в лингвистике, предоставив всесторонний обзор процессов и инструментов, используемых для извлечения значимых выводов из текстовых корпусов.


background image

Topical issues of language training

in the globalized world

409

12.

Temirova, N. A. (2023). CONSECUTIVE INTERPRETATION AS A TYPE OF ORAL
TRANSLATION.

Academia Science Repository

,

4

(6), 197-204.

13.

Satibaldieva, N. (2024). Polysemy of Terms in Computational Linguistics.

International

Journal of Scientific Trends

,

3

(1), 82-84.

Применение специализированных корпусов в анализе полисемантических

терминов

Раджабова Гулноза

УзГУМЯ, старший преподаватель

Аннотация
Эта статья посвящена области лингвистики и фокусируется на важной роли

оцифрованных текстовых коллекций, известных как корпусы, в лингвистических
исследованиях. Корпусы служат незаменимыми ресурсами, предоставляющими обширный
набор данных для лингвистического анализа. Их полезность значительно увеличивается
благодаря программам конкорданса, специализированному программному обеспечению,
которое облегчает детальное исследование текстовых коллекций. Эти программы, особенно
их функция конкорданса, играют ключевую роль, позволяя лингвистам исследовать языковые
модели, находить совпадения и выполнять расчеты частотности. Цель данной статьи –
прояснить методологии и приложения анализа корпусов в лингвистике, предоставив
всесторонний обзор процессов и инструментов, используемых для извлечения значимых
выводов из текстовых корпусов.

Ключевые слова: лингвистика, корпусы, программы конкорданса, инструменты

WordSmith, текстовый анализ, языковые модели, сравнительный анализ, анализ значимых
слов.

Исследование человеческого языка, сложного полотна, сотканного из слов

и значений, представляет собой множество вызовов и возможностей, особенно в

области анализа полисемантических терминов. Полисемия, явление наличия у

слов нескольких значений, является естественным аспектом языка,

добавляющим ему сложности и богатства. Эта статья стремится осветить

значительную

роль

специализированных

корпусов

в

расшифровке

многослойных значений полисемантических терминов, важных в различных

областях, таких как обработка естественного языка, лексикография и

семантический анализ. В лингвистических исследованиях корпусы,

представляющие собой оцифрованные текстовые коллекции, предлагают

неисчерпаемый кладезь данных для анализа. Настоящая польза этих корпусов,

однако, реализуется через использование программ конкорданса. Эти

специализированные инструменты облегчают выполнение ряда функций для


background image

Topical issues of language training

in the globalized world

410

детального изучения текстовых коллекций. Такие программы, особенно их

функция конкорданса, позволяют лингвистам исследовать языковые модели,

выявлять совпадения, рассчитывать частотности и выполнять другие

аналитические задачи (Далиева, 2023). Важность специализированного корпуса

в анализе полисемантических терминов становится все более очевидной в

последние годы. В условиях глобализации и цифровизации потребность в точной

интерпретации и понимании языка в различных областях становится критически

важной.

Специализированные корпусы с их направленными текстовыми

коллекциями предоставляют уникальную возможность для изучения тонких

нюансов и разнообразных контекстов полисемантических терминов. Эти

корпусы не просто хранилища слов; они представляют собой тщательно

отобранные сборники, отражающие сложное использование языка в конкретных

областях или дисциплинах. Применение специализированных корпусов

охватывает различные области, демонстрируя их универсальность и

критическую важность как в академическом, так и в практическом контексте. В

этом

разделе

рассматриваются

несколько

ключевых

исследований,

подчеркивающих разнообразные приложения специализированных корпусов,

каждое из которых вносит уникальный вклад в свои области.

Ян и др. (2023) представили MinBERT, революционную модель глубокого

обучения, предназначенную для анализа медицинских заметок. Это

исследование иллюстрирует преобразующее влияние специализированных

корпусов в медицинской области. MinBERT использует специализированный

корпус медицинских заметок, решая проблему недостатка размеченных

медицинских данных, что является значительным препятствием для применения

искусственного интеллекта в медицинской диагностике. Успех модели,

основанный на способности обрабатывать и анализировать сложные

медицинские тексты, демонстрирует, как специализированные корпусы могут

значительно повысить точность и эффективность диагностических процессов. В


background image

Topical issues of language training

in the globalized world

411

области медиапросвещения Альхаяти, Акрам и Афифи (2023) исследовали

тонкости аудиовизуального перевода (AVT) в анимационном сериале Яхья и

Кунуз. Их работа подчеркивает критическую роль специализированных

корпусов в передаче культурных нюансов в переводе. Применяя

специализированный корпус, охватывающий различные культурные и языковые

элементы, исследование показывает, как полисемантические термины

тщательно обрабатываются в AVT. Этот подход не только обеспечивает

целостность перевода, но и обогащает культурное понимание аудитории,

демонстрируя значимость корпусов в преодолении лингвистических и

культурных барьеров в медиапереводе. В юридической области Чернеи и др.

(2023) провели всестороннее исследование законов о банковской тайне в

различных

юрисдикциях.

Их

исследование

подчеркивает

важность

специализированных юридических корпусов для понимания полисемантической

природы юридических терминов, особенно в такой сложной области, как

банковская тайна.

Сравнивая юридические рамки разных регионов, исследование

демонстрирует, как специализированные корпусы предоставляют информацию

о социально-экономических и правовых контекстах, формирующих

интерпретацию и применение юридических терминов. Это исследование

подчеркивает ценность специализированных корпусов для навигации в сложной

области юридического языка и его последствий. Наконец, Владленов и др. (2023)

предлагают всесторонний взгляд, пересекающий филологию, лингвистику,

технологию и когнитивные науки, подчеркивая роль специализированных

корпусов в образовательных и профессиональных контекстах. Их выводы

подчеркивают необходимость этих корпусов для понимания сложных структур

и нюансов языка. Это исследование иллюстрирует, как специализированные

корпусы служат необходимыми инструментами как в академическом обучении,

так и в профессиональном развитии, способствуя когнитивному развитию

учащихся и специалистов. Исследование специализированных корпусов в


background image

Topical issues of language training

in the globalized world

412

анализе полисемантических терминов, как подчеркивается в этом обзоре,

подчеркивает их незаменимую роль во множестве академических и

практических областей. Эти корпусы, благодаря их направленным и

контекстуализированным наборам данных, предоставляют возможность

изучения тонких значений полисемантических терминов, значительно улучшая

наше понимание языка во всех его многогранных формах. Каждое исследование

показывает, как эти корпусы не только способствуют точной интерпретации

сложных терминов, но и вносят вклад в развитие соответствующих областей. В

медицинской диагностике, например, использование специализированных

корпусов оказалось решающим для повышения точности анализов, основанных

на ИИ.

В области перевода и юридических исследований эти корпусы

предоставляют важные сведения о культурных нюансах и юридических

терминах, тем самым способствуя более эффективной коммуникации и

пониманию в различных контекстах. Кроме того, интеграция передовых

вычислительных техник и методологий со специализированными корпусами

открыла новые возможности для исследований и разработок. Использование

моделей машинного обучения, таких как MinBERT, демонстрирует эту

синергию,

где

вычислительные

мощности

сочетаются

с

богатым

лингвистическим материалом для получения беспрецедентных результатов в

анализе и применении терминов.

Список литературы

1.

Daliyeva Madina, & Sa’dullaeva Gulnoza. (2023). EXPLORING LINGUISTIC

PATTERNS: UNVEILING INSIGHTS FROM TEXT CORPUS AND ANALYTICAL METHODS
. ОБРАЗОВАНИЕ НАУКА И ИННОВАЦИОННЫЕ ИДЕИ В МИРЕ, 24(3), 135–137. Retrieved
from

https://www.newjournal.org/index.php/01/article/view/8075

2.

Alkhayat, M., Akram, A., & Afify, S. (2023). Interlingual Subtitling of Ethno/Cultural

Representation in Selected Episodes of Yahya and Kunooz Animated TV Series (2022). Journal of
Translation and Language Studies, 4(2).

https://doi.org/10.48185/jtls.v4i2.783

3.

Cherniei, V., Cherniavskyi, S., Babanina, V., Tykhonova, О., & Hudkova, H. (2023).

Characteristics of liability for disclosure of bank secrecy in Europe and the United States. Juridicas
CUC, 19(1). https://doi.org/10.17981/juridcuc.19.1.2023.11


background image

Topical issues of language training

in the globalized world

413

4.

Vladlenov, R., et al. (2023). Philology, Linguistics, and the Digital Age: An

Interdisciplinary Approach. Journal of Language and Cognitive Development, 10(1), 87-102.

5.

Yang, L., et al. (2023). Classification of Medical Image Notes for Image Labeling by

Using MinBERT. Journal of Medical Informatics, 22(4), 456-467.

6.

Далиева, М. Х., & Сатибалдиев, Э. К. (2023). ПОЛИСЕМИЯ ТЕРМИНОЛОГИИ

КАК ОБЪЕКТ ИССЛЕДОВАНИЙ В СОВРЕМЕННОМ ЯЗЫКОЗНАНИИ. In

ББК 81.2 я43

Методика преподавания иностранных языков и РКИ: традиции и инновации: сборник
научных трудов VIII Международной научно-методической онлайн-конференции,
посвященной Году педагога и наставника в России и Году русского языка в странах СНГ (11
апреля 2023 г.)–Курск: Изд-во КГМУ, 2023.–521 с.

(p. 47).

7.

Kamilovich, S. E. (2023). EXPLORING LINGUISTIC UNIVERSALS AND

TYPOLOGICAL PATTERNS: AN ANALYSIS OF THE COGNITIVE AND CULTURAL
FACTORS

THAT

SHAPE

LANGUAGE

STRUCTURES

ACROSS

DIVERSE

LANGUAGES.

American Journal of Pedagogical and Educational Research

,

10

, 129-132.

8.

Сатибалдиев,

Э.

К.

(2022).

ЯЗЫКОВОЕ

КОНТАКТИРОВАНИЕ:

БИЛИНГВИЗМ, ПОЛИЛИНГВИЗМ, ИНТЕРФЕРЕНЦИЯ. In

ИНОСТРАННЫЙ ЯЗЫК В

ПРОФЕССИОНАЛЬНОЙ СФЕРЕ: ПЕДАГОГИКА, ЛИНГВИСТИКА, МЕЖКУЛЬТУРНАЯ
КОММУНИКАЦИЯ

(pp. 144-149).

9.

Temirova, N. A. (2023). CONSECUTIVE INTERPRETATION AS A TYPE OF

ORAL TRANSLATION.

Academia Science Repository

,

4

(6), 197-204.

10.

Satibaldieva,

N.

(2024).

Polysemy

of

Terms

in

Computational

Linguistics.

International Journal of Scientific Trends

,

3

(1), 82-84


APPLYING COMPUTER LINGUISTICS ANALYSIS METHODS IN

CATALOGING POLYSEMIC TERMS

Urmonova Dinora

UzSWLU, graduate student

Аннотация

Эта статья посвящена анализу и интерпретации полисемичных терминов в контексте

компьютерной лингвистики. Рассматриваются методы использования корпусного анализа,
семантических алгоритмов и инструментов контекстного анализа для эффективного
различения и категоризации значений полисемичных терминов. Подчеркивается важность
вычислительных инструментов в лингвистике и их роль в понимании эволюции языка.
Исследования демонстрируют, как контекст влияет на значение слов, и показывают значение
междисциплинарного подхода к изучению полисемии.

Ключевые слова:

полисемия, корпусный анализ, семантические алгоритмы,

контекстный анализ, вычислительные инструменты, эволюция языка, лексическая
неоднозначность, междисциплинарный подход.

В постоянно развивающейся области компьютерной лингвистики одной из

наиболее интересных задач является анализ и интерпретация полисемичных

терминов — слов, имеющих несколько значений. Эта сложность имеет

References

Daliyeva Madina, & Sa’dullaeva Gulnoza. (2023). EXPLORING LINGUISTIC PATTERNS: UNVEILING INSIGHTS FROM TEXT CORPUS AND ANALYTICAL METHODS . ОБРАЗОВАНИЕ НАУКА И ИННОВАЦИОННЫЕ ИДЕИ В МИРЕ, 24(3), 135–137. Retrieved from https://www.newjournal.org/index.php/01/article/view/8075

Alkhayat, M., Akram, A., & Afify, S. (2023). Interlingual Subtitling of Ethno/Cultural Representation in Selected Episodes of Yahya and Kunooz Animated TV Series (2022). Journal of Translation and Language Studies, 4(2). https://doi.org/10.48185/jtls.v4i2.783

Cherniei, V., Cherniavskyi, S., Babanina, V., Tykhonova, О., & Hudkova, H. (2023). Characteristics of liability for disclosure of bank secrecy in Europe and the United States. Juridicas CUC, 19(1). https://doi.org/10.17981/juridcuc.19.1.2023.11

Vladlenov, R., et al. (2023). Philology, Linguistics, and the Digital Age: An Interdisciplinary Approach. Journal of Language and Cognitive Development, 10(1), 87-102.

Yang, L., et al. (2023). Classification of Medical Image Notes for Image Labeling by Using MinBERT. Journal of Medical Informatics, 22(4), 456-467.

Далиева, М. Х., & Сатибалдиев, Э. К. (2023). ПОЛИСЕМИЯ ТЕРМИНОЛОГИИ КАК ОБЪЕКТ ИССЛЕДОВАНИЙ В СОВРЕМЕННОМ ЯЗЫКОЗНАНИИ. In ББК 81.2 я43 Методика преподавания иностранных языков и РКИ: традиции и инновации: сборник научных трудов VIII Международной научно-методической онлайн-конференции, посвященной Году педагога и наставника в России и Году русского языка в странах СНГ (11 апреля 2023 г.)–Курск: Изд-во КГМУ, 2023.–521 с. (p. 47).

Kamilovich, S. E. (2023). EXPLORING LINGUISTIC UNIVERSALS AND TYPOLOGICAL PATTERNS: AN ANALYSIS OF THE COGNITIVE AND CULTURAL FACTORS THAT SHAPE LANGUAGE STRUCTURES ACROSS DIVERSE LANGUAGES. American Journal of Pedagogical and Educational Research, 10, 129-132.

Сатибалдиев, Э. К. (2022). ЯЗЫКОВОЕ КОНТАКТИРОВАНИЕ: БИЛИНГВИЗМ, ПОЛИЛИНГВИЗМ, ИНТЕРФЕРЕНЦИЯ. In ИНОСТРАННЫЙ ЯЗЫК В ПРОФЕССИОНАЛЬНОЙ СФЕРЕ: ПЕДАГОГИКА, ЛИНГВИСТИКА, МЕЖКУЛЬТУРНАЯ КОММУНИКАЦИЯ (pp. 144-149).

Temirova, N. A. (2023). CONSECUTIVE INTERPRETATION AS A TYPE OF ORAL TRANSLATION. Academia Science Repository, 4(6), 197-204.

Satibaldieva, N. (2024). Polysemy of Terms in Computational Linguistics. International Journal of Scientific Trends, 3(1), 82-84