SOLUTION OF SOCIAL PROBLEMS IN
MANAGEMENT AND ECONOMY
International scientific-online conference
18
O‘ZBEK TILINING MULTIMEDIYA KORPUSINI YARATISH
TAMOYILLARI
Saydaliyeva Matluba Shuxrat qizi
O‘zXIA akademik litseyi ijtimoiy-gumanitar fanlar
kafedrasi ona tili va adabiyot fani o‘qituvchisi
https://doi.org/10.5281/zenodo.11544755
Annotation:
The article is devoted to the need to create a multimedia
corps within the Uzbek language national corps. The researcher has
demonstrated the advantages of the multimedia corpus over other traditional
ready-made multimedia applications, and concludes that the issue of its creation
is relevant.
Kalit so‘zlar:
Korpus lingvistikasi, kinematografik materiallar, subkorpus,
klip, klipmatn, klikst, imo-ishora komponenti,
Hozirgi kunda korpus lingvistikasi o'z taraqqiyotida jadal sur'atlarni
boshdan kechirmoqda. Elektron korpusning yaratilishi nafaqat filologik
bilimlarning turli sohalarini rivojlantirish va tartibga solishga yordam beradi,
balki til tarixini, grammatikasini va funktsional va tipologik xususiyatlarini aks
ettirishga imkon beradi.
Multimediya korpusi ovozli nutqni o'rganish uchun mo'ljallangan elektron
resurs bo'lib, unda nutqning talaffuz holatlari ham keltiriladi. Ayni paytda
korpus tilshunoslari orasida og‘zaki nutqda hissiyotlarni yetkazish usullari –
ajablanish, quvonch, qayg‘u kabilarni ifodlashni o‘rganishga katta qiziqish
mavjud. Bunday tadqiqotlarda multimediya subkorpusi yordam beradi.
Tilshunoslar unda mutlaqo boshqa sharoitlarda ishlaydi.
O’zbek tili multimediya korpusi
qurish tamoyillari juda aniq – kino fayllari,
video va audio fayllar minimal integral birliklarga (kliplarga) kesiladi va ularga
transkripsiya elementlari biriktiriladi. Matnli materiallar bilan birga birikkan
kliplar klipmatn deb ataladi.
O’zbek tili multimediya korpusi
birinchi
navbatda
milliy
kinematografik materiallar asosida yaratilishi rejalashtirilgan.
Har bir klip o'zining meta-tavsifiga ega bo'ladi. Ushbu meta-tavsif o’z
ichiga quyidagilarni oladi: butun matn muallifiga tegishli parametrlar, yaratilgan
sanasi, janr xususiyatlari, filmlar uchun – qahramon va aktyorning ismi, tug'ilgan
yili va jinsi. Klipmatnning nutq komponentini tavsiflovchi parametrlarning
ma’lum tizimi beriladi:
vaziyat turi
nutq harakatlarining turi (savol, so‘rov, kechirim, maslahat va hk.)
SOLUTION OF SOCIAL PROBLEMS IN
MANAGEMENT AND ECONOMY
International scientific-online conference
19
nutq harakatlarining to‘liqligi (to‘liq, tugallanmagan, uzilib qolgan)
nutq uslubi (oddiy nutq, pichirlash, qichqiriq, diktant)
takrorlanishning mavjudligi va turlari (bitta, ko‘p, takroran so‘rab, iqtibos
keltirish, taqlid qilish);
vokal imo-ishoralarning mavjudligi va turlari (qarsak chalish, qarsak
chalish, hushtak chalish, imo qilish va boshqalar);
notiqlarning xususiyatlari (soni, jinsi, gapiradigan tili)
Bundan tashqari, parametrlar tizimi ishlab chiqilgan bo‘lib, unga ko‘ra klip
va klipmatnning imo-ishora komponenti tavsiflangan
1
:
imo-ishorani bajaradigan organ (qo‘l, bosh, gavda, oyoq)
faol organ (qo‘l, bosh, kaft, iyak, ko‘z va boshqalar);
passiv organ (qo‘l, bosh, ko‘krak)
adapter (tananing tarkibiga kirmaydigan, ammo imo-ishoraning zaruriy
komponenti, masalan, imo-ishora uchun kiyim "ko‘ylagi" ni to‘g‘rilaydi);
faol organning harakat yo‘nalishi (yuqoriga, oldinga, orqaga, yonga,
pastga, tepadan, oldidan, orqadan, yondan, pastdan, aylanasiga va
boshqalar);
imo-ishoralarning chastotasi (bitta / ko‘p);
imo-ishora turi (ichki holat, deyktik, dekorativ);
imo-ishoraning nomi (boshni chayqatish, ko‘zni yumish, qo‘lni silkitish);
kommunikativ harakat turi / ichki holat turi (salomlashish, kechirim
so‘rash, xayrlashish, kelishuv, rad etish, tahdid, tasalli va hk.; noziklik,
ajablanish, quvonch, taxmin va boshqalar);
to‘siqning mavjudligi (imo-ishoralarning to‘liq bajarilishiga xalaqit
beradigan obekt);
imo-ishoraning to‘liqligi (to‘liq, uzilib qolgan, o‘zgartirilgan va hk);
imo-ishoraning haqiqiyligi (tasvirlangan, aks ettirilgan, taqlid qilingan va
boshqalar).
O’zbek tili multimediya korpusi
yaratilishi bilan qidiruv vositasi paydo
bo'ladi. Bosqich juda oddiy edi: biz filmni bo'laklarga bo'lishimiz va transkriptni
xuddi shu tarzda kesib olishimiz kerak va ularni bir-biriga moslaymiz. Shunday
qilib, bizda sakkizdan yigirma besh soniyagacha bo'lgan qisqa klip bor, unda
ba'zi matnlar eshitiladi va ba'zi odamlar biror xatti-harakat qilishadi – xususan,
imo-ishora. Va unga dekodlashning aynan bir xil qismi mavjud. Biz bir vaqtning
[
1
Ш.М. Ҳамроева “Корпус лингвистикаси атамаларининг қисқача изоҳли луғати” Бухоро 2018]
SOLUTION OF SOCIAL PROBLEMS IN
MANAGEMENT AND ECONOMY
International scientific-online conference
20
o'zida u yerda nima bo'layotganini o'qishimiz va ko'rishimiz mumkin. Biz ikkita
narsaga bir xil nom beramiz va keyin bizning dasturchilar korpusning qidiruv
tizimida matndan so'rovimiz natijasida faqat bitta matn emas, balki unga
biriktirilgan klip ham chiqadi. Ya’ni, biz Milliy Korpusdagi kabi nafaqat matnlar
to'plamini olamiz, balki har bir matn uchun u yerda nima sodir bo'layotganini
tinglashimiz va ko'rishimiz mumkin.
Shubhasiz, multimediya korpusi o’zbek intonatsiyasi tadqiqotchilari, lug'at,
morfologiya, semantika va sotsiologiya bilan bog'liq bo'lgan ko'rinishlarda
(so'zlovchilarning jinsi va yoshi xususiyatlari), shuningdek, o’zbek tilini
o'rganuvchilar
uchun
juda
muhimdir.
Shunday qilib, dastlabki rejalarga ko'ra,
o’zbek tili multimediya korpusi
ikki
qismdan iborat bo'ladi:
1.
Tegishli skriptlar bilan bog'langan Clicksta (filmlardan kesib olingan
kliplar). Ushbu qism manba materialini "kesish" uchun ko’p vaqt va katta
miqdordagi qo'l mehnatini o'z ichiga oladi.
2.
Kliplarga biriktirilgan qo'shimcha meta-tavsiflar. Ikkinchi qismini yaratish
birinchisidan ko'ra ko'proq kuch talab qilishi aniq. Chunki har bir klip
ustida alohida metatavsiflar ishlab chiqish lozim.
Tadqiqotimiz doirasida biz beshta o’zbek milliy filmlarini tanlab oldik. Bular:
“Mahallada duv-duv gap”, “Abdullajon”, “Kelinlar qo’zg’aloni”, “Suyunchi”,
“Shum bola”. Multimediya korpusi yaratish uchun ishning keyingi bosqichi
ushbu filmlarni bir daqiqadan ko’p bo’lmagan kichik kliplarga bo’lib chiqish.
Bunda asosiy shart kesilgan klipda jumla yakunlangan bo’lishi lozim. Ishning
keyingi bosqichida biz har bir kesilgan klipga meta-tavsif tuzib chiqamiz.
“Bu hovlida bir gapim ikki bo’lmaydi, to’g’rimi?” Ushbu matn “Kelinlar
qo’zg’aloni” dan kesib olingan klipga biriktiriladi va unga qo’shimcha
ravishda meta-tavsif tuzamiz.
Film nomi Sana Murojaatning
kimga
yoki
nimaga
qaratilganligi
Aktyor
Aktyor-
ning
jinsi
Tug‘ilgan
yili
Imo-ishora
turi
Faol
a’zo
“Kelinlar
qo’zg’aloni”
1984 atrofidagilarga Tursunoy
Jafarova
Ayol
1915
Atrofdagilarga
boshini
silkitib
Bosh
.
Foydalanilgan adabiyotlar ro’yxati:
1.
[Ҳамроева Ш.М. “Корпус лингвистикаси атамаларининг қисқача
изоҳли луғати” Бухоро 2018]
SOLUTION OF SOCIAL PROBLEMS IN
MANAGEMENT AND ECONOMY
International scientific-online conference
21
2.
[Po‘latov A., Muhamedova S. Kompyuter lingvistikasi. – T., 2007]
3.
[Кутузов А.Б. Корпусная лингвистика. − (Электрон ресурс): Лицензия
Creative
commons
Attribution
ShareAlike
3.0
Unported
-
//lab314.brsu.by/kmp-lite/kmp-video/CL/CorporeLingva.pdf]
4.
[Захаров В.П., Богданова С.Ю. Корпусная лингвистика.– Иркутск:
ИГЛУ, 2011. –161 c.]
5.
[Богданова Н.В. О корпусе текстов живой речи: новые поступления и
первые результаты исследования // Труды международной конференции
«Диалог2010»]
6.
[Гришина Е.А. Мультимедийный русский корпус (МУРКО):
проблемыаннотации // Национальный корпус русского языка:2006--2008.
Новые результаты и перспективы. - СПб., 2009. С. 175-214]
7.
[Гришина Е.А., СавчукС.О. Корпус звучащей русской речив составе
Национального корпуса русского языка. Проект.// Трудымеждународной
конференции «Диалог 2008»]
